特許7465646 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 開本亮の特許一覧

特許7465646予測装置、予測方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-04-03

(45)【発行日】2024-04-11

(54)【発明の名称】予測装置、予測方法、およびプログラム

(51)【国際特許分類】

G06F 16/903 20190101AFI20240404BHJP

【ＦＩ】

G06F16/903

【請求項の数】 9

(21)【出願番号】P 2019191726

(22)【出願日】2019-10-21

(65)【公開番号】P2021068080

(43)【公開日】2021-04-30

【審査請求日】2022-08-29

(73)【特許権者】

【識別番号】524046250

【氏名又は名称】開本亮

(74)【代理人】

【識別番号】100115749

【弁理士】

【氏名又は名称】谷川英和

(72)【発明者】

【氏名】開本亮

【審査官】成瀬博之

(56)【参考文献】

【文献】韓国公開特許第１０－２０１６－００５０７２９（ＫＲ，Ａ）

【文献】特開２００７－０８６９８６（ＪＰ，Ａ）

【文献】特開２００５－３０１３８９（ＪＰ，Ａ）

【文献】国際公開第２００５／０４１０９６（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

創出時を特定する創出時情報に対応する３以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部と、
前記文献集合に含まれる３以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する２以上の時間間隔情報を取得する時間間隔情報取得部と、
前記２以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、
前記将来創出時情報を出力する出力部とを具備し、
前記創出時予測部は、
前記時間間隔情報取得部が取得した２以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得手段と、
前記時間間隔情報取得部が取得した２以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得手段と、
前記間隔代表値情報と前記ばらつき情報とをＢＰＴ分布モデル又は対数正規分布モデルに適用し、前記将来創出時情報を取得する将来創出時情報取得手段とを具備する予測装置。

【請求項2】

前記創出時予測部は、
前記ばらつき情報取得手段が取得したばらつき情報が特定するばらつきが、予め決められた条件を満たすほど、大きいか小さいかを判断する判断手段をさらに具備し、
前記出力部は、
前記判断手段が、予め決められた条件を満たすほどばらつきが小さいと判断した場合に、前記将来創出時情報を出力する請求項１記載の予測装置。

【請求項3】

前記文献集合格納部の前記３以上の各科学文献情報は、１または２種類以上の分類コードに対応し、
少なくとも一の種類の分類コードは２階層以上に階層化されたコードであり、下位のコードよりも上位のコードである上位コードを有するコードであり、
前記文献集合格納部の３以上のいずれかの科学文献情報には、前記少なくとも一の種類の分類コードについて、筆頭分類コードに加えて筆頭以外分類コードが対応付いており、
前記間隔代表値情報取得手段は、
前記判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、前記一の種類の筆頭分類コードを含む上位コードおよび筆頭以外分類コードを含む上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報の代表値である間隔代表値情報を取得し、
前記ばらつき情報取得手段は、
前記判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、前記一の種類の筆頭分類コードを含む上位コードおよび筆頭以外分類コードを含む上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報に対するばらつき情報を取得し、
前記将来創出時情報取得手段は、
前記判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、前記間隔代表値情報と前記ばらつき情報とを用いて、前記将来創出時情報を取得する請求項２記載の予測装置。

【請求項4】

少なくとも一の種類の１以上の分類コードに対応付けられた２以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された学習器が格納される学習器格納部と、
前記文献集合格納部の３以上の各科学文献情報に対して、前記学習器を用いて、機械学習のアルゴリズムにより、前記一の種類の１以上の分類コードを付与し、前記３以上の各科学文献情報に対応付ける分類コード付与部とをさらに具備する請求項３記載の予測装置。

【請求項5】

前記科学文献情報は、学術論文の情報であり、
前記１または２種類以上の分類コードのうちの一の種類が前記分類コード付与部が付与したＩＰＣ分類コードであり、
前記創出時情報は、論文発表日を特定する情報である請求項４記載の予測装置。

【請求項6】

前記科学文献情報は、特許出願の情報であり、
前記１または２種類以上の分類コードのうちの一の種類が前記分類コード付与部が付与したＪＳＴ分類コードであり、
前記創出時情報は、特許出願日を特定する情報である請求項４記載の予測装置。

【請求項7】

分類コードを用いた検索情報を受け付ける受付部と、
前記検索情報に合致する分類コードに対応する３以上の科学文献情報を取得する検索部とをさらに具備し、
前記文献集合格納部に格納されている３以上の科学文献情報は、前記検索部が取得した科学文献情報である請求項１から請求項６いずれか一項に記載の予測装置。

【請求項8】

創出時を特定する創出時情報に対応する３以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部と、時間間隔情報取得部と、創出時予測部と、出力部とを具備する予測装置により実現される予測方法であって、
前記時間間隔情報取得部が、前記文献集合に含まれる３以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する２以上の時間間隔情報を取得する時間間隔情報取得ステップと、
前記創出時予測部が、前記２以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測ステップと、
前記出力部が、前記将来創出時情報を出力する出力ステップとを具備し、
前記創出時予測ステップは、
前記時間間隔情報取得部が取得した２以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得サブステップと、
前記時間間隔情報取得部が取得した２以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得サブステップと、
前記間隔代表値情報と前記ばらつき情報とをＢＰＴ分布モデル又は対数正規分布モデルに適用し、前記将来創出時情報を取得する将来創出時情報取得サブステップとを具備する予測方法。

【請求項9】

創出時を特定する創出時情報に対応する３以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部にアクセス可能なコンピュータを、
前記文献集合に含まれる３以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する２以上の時間間隔情報を取得する時間間隔情報取得部と、
前記２以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、
前記将来創出時情報を出力する出力部として機能させるためのプログラムであって、
前記創出時予測部は、
前記時間間隔情報取得部が取得した２以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得手段と、
前記時間間隔情報取得部が取得した２以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得手段と、
前記間隔代表値情報と前記ばらつき情報とをＢＰＴ分布モデル又は対数正規分布モデルに適用し、前記将来創出時情報を取得する将来創出時情報取得手段とを具備するものとして、前記コンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、科学文献等の将来の創出時に関する情報を取得し、出力する予測装置等に関するものである。

【背景技術】

【0002】

従来、予測対象論文が出版されてから短期間のデータのみを用いて、萌芽領域の予測結果を得る技術があった（例えば、特許文献１参照）。

【0003】

本技術は、萌芽論文の予測のための方法であって、予測モデルを構築するステップ、構築された予測モデルを評価するステップ、及び構築された予測モデルを用いて予測を行うステップを含み、予測モデルを構築するステップは、データベースから論文データを取得するステップ、取得した論文データから論文の書誌情報及び引用ネットワークを抽出するステップ、抽出した論文の書誌情報及び引用ネットワークから論文の各特徴量を算出するステップ、並びに算出された各特徴量を説明変数とし萌芽論文を被説明変数として教師ありクラス分類を行なうステップを含み、前記予測モデルを構築するステップにおいて算出される特徴量には、著者名、著者特徴量、論文誌名、及び論文誌特徴量を含まず、構築された予測モデルを評価するステップは、被予測萌芽論文の論文データ及び被予測萌芽論文が公表された日が属する一定期間に公表された論文の論文データをデータベースから取得するステップ、並びに構築された予測モデルを評価指標で評価するステップを含み、構築されたモデルを用いて予測を行うステップは、予測の対象とする論文の論文データをデータベースから取得するステップ、及び予測の対象とする論文が萌芽論文であるか否かを予測するステップを含む、萌芽領域の予測方法である。

【0004】

また、従来、学術論文を国際特許分類（ＩＰＣ）に対応付ける技術があった（例えば、非特許文献１参照）。なお、ＩＰＣは、適宜、ＩＰＣ分類コードとも言う。

【先行技術文献】

【特許文献】

【0005】

【文献】特開２０１７－１７４３５７号公報

【非特許文献】

【0006】

【文献】難波英嗣、外３名、“学術論文の国際特許分類への自動分類”、［online］、Ｊａｐｉｏ２００８ＹＥＡＲＢＯＯＫ、［令和１年１０月４日検索］、インターネット［URL：http://www.japio.or.jp/00yearbook/files/2008book/08_4_04.pdf#search=%27%E9%9B%A3%E6%B3%A2%E8%8B%B1%E5%97%A3+%E8%AB%96%E6%96%87+%EF%BC%A9%EF%BC%B0%EF%BC%A3%E4%BB%98%E4%B8%8E%27］

【発明の概要】

【発明が解決しようとする課題】

【0007】

しかしながら、従来技術においては、技術の将来の創出時に関する情報を取得できなかった。なお、技術の創出とは、ここでは、例えば、科学文献等の創出である。科学文献等の創出は、例えば、科学文献等の発表である。

【0008】

その結果、例えば、大学や研究機関等において、特許出願や産学連携等を担当する担当者が、適切な時期に研究者にコンタクトし、科学文献等の創出前ドラフトを、特許出願や産学連携等の対象として研究支援を行うことが理想的ではあるが、コンタクトのタイミングを見計らうことは容易ではなかった。つまり、例えば、上記担当者が研究者へのコンタクトが遅すぎた場合、研究支援を行おうとした際には、研究者が、既に論文発表をしており、新規性を喪失し特許出願できない、または産学連携が上手く進められない、といったことも起こり得た。一方、早すぎた場合、支援対象が具体化されておらず、反って研究者の時間を取ってしまうことにも繋がっていた。またオープンイノベーションによる研究開発を行う場合、関係する多くの研究者の研究成果がどの段階で発表されるのかを、事前に予想することは従来できなかったため、研究マネジメントを円滑に進めることが難しかった。

【課題を解決するための手段】

【0009】

本第一の発明の予測装置は、１または２種類以上の分類コードと創出時を特定する創出時情報とに対応する３以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部と、文献集合に含まれる３以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する２以上の時間間隔情報を取得する時間間隔情報取得部と、２以上の時間間隔情報を用いて、文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、将来創出時情報を出力する出力部とを具備する予測装置である。

【0010】

かかる構成により、技術の将来の創出時に関する情報を取得しうる。

【0011】

また、本第二の発明の予測装置は、第一の発明に対して、少なくとも一の種類の１以上の分類コードに対応付けられた２以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された学習器が格納される学習器格納部と、文献集合格納部の３以上の各科学文献情報に対して、学習器を用いて、機械学習のアルゴリズムにより、一の種類の１以上の分類コードを付与し、３以上の各科学文献情報に対応付ける分類コード付与部とをさらに具備する予測装置である。

【0012】

かかる構成により、技術の将来の創出時に関する情報を取得できる。

【0013】

また、本第三の発明の予測装置は、第一または第二の発明に対して、創出時予測部は、時間間隔情報取得部が取得した２以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得手段と、時間間隔情報取得部が取得した２以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得手段と、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する将来創出時情報取得手段とを具備する予測装置である。

【0014】

かかる構成により、技術の将来の創出時に関する適切な情報を取得できる。

【0015】

また、本第四の発明の予測装置は、第三の発明に対して、将来創出時情報取得手段は、間隔代表値情報とばらつき情報とをＢＰＴ分布モデル又は対数正規分布モデルに適用し、将来創出時情報を取得する予測装置である。

【0016】

かかる構成により、技術の将来の創出時に関する適切な情報を取得できる。

【0017】

また、本第五の発明の予測装置は、第三または第四の発明に対して、創出時予測部は、ばらつき情報取得手段が取得したばらつき情報が特定するばらつきが、予め決められた条件を満たすほど、大きいか小さいかを判断する判断手段をさらに具備し、出力部は、判断手段が、予め決められた条件を満たすほどばらつきが小さいと判断した場合に、将来創出時情報を出力する予測装置である。

【0018】

かかる構成により、技術の将来の創出時に関するより適切な情報を取得できる。

【0019】

また、本第六の発明の予測装置は、第五の発明に対して、少なくとも一の種類の分類コードは２階層以上に階層化されたコードであり、下位のコードよりも上位のコードである上位コードを有するコードであり、文献集合格納部の３以上のいずれかの科学文献情報には、少なくとも一の種類の分類コードについて、筆頭分類コードに加えて筆頭以外分類コードが対応付いており、間隔代表値情報取得手段は、判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報の代表値である間隔代表値情報を取得し、ばらつき情報取得手段は、判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報に対するばらつき情報を取得し、将来創出時情報取得手段は、判断手段が、予め決められた条件を満たすほどばらつきが小さいと判断した場合、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する予測装置である。

【0020】

かかる構成により、技術の将来の創出時に関するより適切な情報を取得できる。

【0021】

また、本第七の発明の予測装置は、分類コードと創出時情報とに対応する３以上の科学文献情報の集合である文献集合が格納される文献集合格納部と、分類コードに対応付けられた２以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された学習器が格納される学習器格納部と、文献集合格納部の３以上の各科学文献情報に対して、学習器を用いて、機械学習のアルゴリズムにより、１以上の分類コードを付与し、３以上の各科学文献情報に対応付け、かつ１以上の各分類コードに対応するスコア値を取得する分類コード付与部と、１以上の各分類コードごとに、分類コード付与部が科学文献情報に対して付与処理を行った場合に取得したスコア値と、当該科学文献情報に対応する創出時情報とを用いて、将来の時におけるスコア値を含む将来創出時情報を取得する創出時予測部と、将来創出時情報を出力する出力部とを具備する予測装置である。

【0022】

かかる構成により、将来に創出される技術分野に関する情報を得ることができる。また、本第八の発明の予測装置は、第一から第七いずれか１つの発明に対して、科学文献情報は、学術論文の情報であり、１または２種類以上の分類コードのうちの一の種類が分類コード付与部が付与したＩＰＣ分類コードであり、創出時情報は、論文発表日を特定する情報である予測装置である。

【0023】

かかる構成により、ＩＰＣ分類コードを用いて、将来の論文発表日に関する情報を取得できる。

【0024】

また、本第九の発明の予測装置は、第一から第七いずれか１つの発明に対して、科学文献情報は、特許出願の情報であり、１または２種類以上の分類コードのうちの一の種類が分類コード付与部が付与したＪＳＴ分類コードであり、創出時情報は、特許出願日を特定する情報である予測装置である。

【0025】

かかる構成により、ＪＳＴ分類コードを用いて、特許出願日に関するより適切な情報を取得できる。

【0026】

また、本第十の発明の予測装置は、第一から第九いずれか１つの発明に対して、分類コードを用いた検索情報を受け付ける受付部と、検索情報に合致する分類コードに対応する３以上の科学文献情報を取得する検索部とをさらに具備し、文献集合格納部に格納されている３以上の科学文献情報は、検索部が取得した科学文献情報である予測装置である。

【0027】

かかる構成により、受け付けた検索情報に合致する科学文献情報の分野における、技術の将来の創出時に関するより適切な情報を取得できる。

【発明の効果】

【0028】

本発明による予測装置によれば、技術の将来の創出時に関する情報を取得できる。

【図面の簡単な説明】

【0029】

【図1】実施の形態１における予測装置Ａのブロック図

【図2】同予測装置Ａが将来創出時情報を取得する処理の例について説明するフローチャート

【図3】同時間間隔情報取得処理の例について説明するフローチャート

【図4】同創出時予測処理の例について説明するフローチャート

【図5】同予測装置Ａが学習器を構築する処理の例について説明するフローチャート

【図6】同予測装置Ａが分類コードを科学文献情報に対応付ける処理の例について説明するフローチャート

【図7】同出力例を示す図

【図8】同論文発表間隔に関して表示する図

【図9】同論文発表間隔に関して表示する図

【図10】同出力例を示す図

【図11】同スコア値取得のための元情報を管理する表を示す図

【図12】同出力例を示す図

【図13】同出力例を示す図

【図14】同コンピュータシステムの概観図

【図15】同コンピュータシステムのブロック図

【発明を実施するための形態】

【0030】

以下、予測装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。

【0031】

（実施の形態１）
本実施の形態において、１または２種類以上の分類コードと、創出時に関する創出時情報とに対応する３以上の科学文献情報が格納されており、当該２以上の各科学文献情報に対応する創出時情報を用いて、時間間隔を特定する２以上の時間間隔情報を用いて、当該分類コードに対応する論文の将来の創出時に関する将来創出時情報を取得し、出力する予測装置について説明する。なお、本実施の形態において、１または２種類以上の分類コードは、例えば、後述するように、機械学習のアルゴリズムにより自動付与される。

【0032】

また、本実施の形態において、取得した２以上の時間間隔情報を用いて、一の種類の分類コードごとに、時間間隔情報の代表値である間隔代表値情報（μ）（例えば、時間間隔の平均値）と、時間間隔情報のばらつきに関するばらつき情報（α）（例えば、変動係数）とを取得し、当該間隔代表値情報と当該ばらつき情報とを用いて将来創出時情報を取得する予測装置について説明する。

【0033】

また、本実施の形態において、予測装置は、例えば、間隔代表値情報とばらつき情報に対して、ＢＰＴ分布モデル又は対数正規分布モデルを適用することにより将来創出時情報を取得する。

【0034】

また、本実施の形態において、例えば、ばらつき情報が予め決められた条件を満たす場合に、将来創出時情報を取得し、出力する予測装置について説明する。

【0035】

また、本実施の形態において、例えば、科学文献情報には、筆頭分類コードに加えて筆頭以外分類コードが付与されている科学文献情報があり、予め決められた条件を満たさない場合、筆頭以外分類コードをも用いて、一の種類の分類コードごとに、間隔代表値情報とばらつき情報とを取得し、ばらつき情報が予め決められた条件を満たす分類コードに対して、将来創出時情報を取得し、出力する予測装置について説明する。なお、予め決められた条件は、通常、ばらつきが小さいことである。

【0036】

また、本実施の形態において、科学文献情報には、筆頭分類コードに加えて筆頭以外分類コードが付与され得、かつ分類コードは階層化されており、下位の筆頭分類コードでは、ばらつき情報が予め決められた条件を満たさない場合、例えば、筆頭以外分類コードをも用いて、かつ下位より上位の分類コードを用いて、上位分類コードごとに、間隔代表値情報とばらつき情報とを取得し、ばらつき情報が予め決められた条件を満たす分類コードに対して、将来創出時情報を取得し、出力する予測装置について説明する。

【0037】

また、本実施の形態において、分類コードに対して、特定の時に発表されるスコア値を取得する予測装置について説明する。

【0038】

なお、本実施の形態において、例えば、科学文献情報が学術論文であり、一の種類の分類コードが分類コード付与部が付与した国際特許分類コード（以下、適宜、ＩＰＣ分類コード、ＩＰＣとも言う。）であり、創出時情報が論文発表日を特定する情報である。また、本実施の形態において、例えば、科学文献情報が特許出願書類であり、一の種類の分類コードが分類コード付与部が付与したＪＳＴ分類コードであり、創出時情報が特許出願日を特定する情報である。分類コードは、階層化されている情報であることは好適である。また、科学文献情報に対応する分類コードは、２以上でも良い。また、科学文献情報に２以上の分類コードが対応付いている場合、当該２以上の分類コードのうちの一の分類コードは筆頭の分類コードであり、他の分類コードは筆頭以外分類コードであることは好適である。

【0039】

さらに、本実施の形態において、分類コードを含む検索情報を受け付け、当該検索情報に対応する２以上の科学文献情報である部分集合情報を決定する予測装置について説明する。

【0040】

図１は、本実施の形態における予測装置Ａのブロック図である。

【0041】

予測装置Ａは、格納部１、受付部２、処理部３、および出力部４を備える。格納部１は、例えば、文献集合格納部１１、および学習器格納部１２を備える。処理部３は、例えば、学習部３０、分類コード付与部３１、検索部３２、時間間隔情報取得部３３、および創出時予測部３４を備える。創出時予測部３４は、例えば、間隔代表値情報取得手段３４１、ばらつき情報取得手段３４２、判断手段３４３、および将来創出時情報取得手段３４４を備える。

【0042】

なお、予測装置Ａの処理部３は、学習部３０と分類コード付与部３１とを含まなくても良い。かかる場合、自動的に分類コードを付与することが行われない、または図示しない他の装置により学習部３０と分類コード付与部３１との処理が行われる。

【0043】

格納部１には、各種の情報が格納される。各種の情報とは、例えば、後述する文献集合、後述する学習器、予め決められた条件、終了条件、２以上の特許情報、エラーメッセージである。

【0044】

予め決められた条件は、後述するばらつきに関する条件である。予め決められた条件は、ばらつき情報に関する条件である。予め決められた条件は、ばらつきが小さいことを特定する条件である。予め決められた条件は、例えば、ばらつき情報が閾値以下または閾値未満であることである。なお、ばらつき情報は、例えば、後述するＢＰＴ分布モデルにおける変動係数が好適であるが、分散、標準偏差等、ばらつきを特定する情報であれば良い。

【0045】

終了条件は、創出時予測処理の終了のための条件である。終了条件は、例えば、着目している分類コードに関する条件である。終了条件は、例えば、着目している分類コードの階層に関する条件である。終了条件は、例えば、着目している分類コードの階層が予め決められた階層であること、着目している分類コードの階層が最上位の階層であること、着目している分類コードの階層が最上位から下に２番目の階層であること、着目している分類コードが筆頭以外分類コードも含んでいること等である。終了条件は、例えば、ばらつき情報に関する条件でも良い。終了条件は、例えば、着目している分類コードとばらつき情報とに関する条件でも良い。終了条件は、例えば、着目している分類コードの階層が予め決められた階層であり、かつばらつき情報が閾値以上または閾値より大きいことである。なお、着目している分類コードとは、処理に使用している分類コードと言っても良い。着目している分類コードは、筆頭分類コードが好適であるが、筆頭分類コードと１以上の筆頭以外分類コードでも良く、１以上の筆頭以外分類コードでも良い。

【0046】

特許情報は、通常、特許明細書、特許請求の範囲、要約書のうちの１以上の情報を含む。特許情報は、公開特許公報、登録特許公報でも良い。

【0047】

格納部１の３以上の各特許情報は、１または２種類以上の分類コードに対応付いている。ここでの分類コードは、特許分類コードである。特許分類コードの種類は、例えば、ＩＰＣ、ＦＩ、Ｆターム、ＣＰＣである。また、３以上の各特許情報は、一の種類の１または２以上の特許分類コードに対応付いている。ここでの１以上の特許分類コードのうちの一の特許分類コードは筆頭分類コードであり、他の特許分類コードは筆頭以外分類コードである。

【0048】

文献集合格納部１１には、文献集合が格納される。文献集合は、３以上の科学文献情報の集合である。文献集合は、通常、処理対象の３以上の科学文献情報の集合である。科学文献情報とは、科学または技術等に関する文献の情報である。科学文献情報は、例えば、学術論文の情報、科学文献情報、特許情報である。科学文献情報は、例えば、ファイル、データベースのレコード等であるが、そのデータ構造は問わない。

【0049】

また、科学文献情報には、１または２種類以上の分類コードと創出時情報とが対応付いている。情報Ａに情報Ｂが対応付くことは、情報Ａから情報Ｂを取得できれば足りる。情報Ａに情報Ｂが対応付くことは、例えば、情報Ａと情報Ｂとがリンク付いていること、情報Ａと情報Ｂとが同一のファイル内に存在すること、情報Ａと情報Ｂとが同一のレコード内に存在すること、情報Ａが情報Ｂを含むこと等である。

【0050】

科学文献情報に対応付く分類コードは、科学文献情報を分類するための情報である。分類コードは、例えば、ＪＳＴ分類コード、特許分類コードである。ＪＳＴ分類コードについては、例えば、ＵＲＬ「http://t21help.nikkei.co.jp/reference/docs/JD3_sousa.pdf」に記載されている説明を参照のこと。また、特許分類コードは、例えば、ＩＰＣ、Ｆターム、ＦＩ、ＣＰＣ等である。なお、科学文献情報にＪＳＴ分類コードが対応付いている状況において、後述する分類コード付与部３１により、特許分類コードが自動的に対応付けられることは好適である。なお、自動的に対応付けられる特許分類コードは、例えば、ＩＰＣである。

【0051】

創出時情報とは、創出時を特定する情報である。創出時とは、公開日でも良い。つまり、創出とは、ここでは公開でも良い。創出時情報は、例えば、論文発表日、ウェブページへの掲載日、特許出願日等である。

【0052】

エラーメッセージは、例えば、将来創出時情報を取得できなかった旨の情報、将来創出時を予測することが困難であることを示す情報、エラーコード（例えば、「－１」）等である。

【0053】

学習器格納部１２には、学習器が格納される。学習器は、後述する学習部３０が作成した情報である。学習器は、科学文献情報に基づく情報を入力とし、１または２以上の分類コードを出力とするための情報である。科学文献情報に基づく情報とは、科学文献情報の全部または一部、または科学文献情報を加工した情報である。学習器は、例えば、一の種類の１以上の分類コードに対応付けられた２以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された情報である。学習器を作成する学習部３０の詳細については後述する。

【0054】

受付部２は、各種の指示や情報等を受け付ける。各種の指示や情報等は、例えば、開始指示、分類コードを用いた検索情報、スコア値算出時期情報である。

【0055】

開始指示は、将来創出時情報を出力する動作の開始指示である。開始指示は、検索情報を含むことは好適である。

【0056】

検索情報は、処理対象の科学文献情報を決定するための条件の情報である。検索情報は、例えば、検索式、検索モジュールである。検索式は、例えば、ＳＱＬ等で記載されているが、その記載方法やデータ構造等は問わない。検索情報は、一の種類の１または２以上の分類コードを含むことは好適である。検索情報が含む１以上の分類コードの中には、１つの筆頭分類コードと１以上の筆頭以外分類コードが存在することは好適である。また、検索情報は、２以上の種類の分類コードを含んでも良い。検索情報は、ＩＰＣ分類コードとＪＳＴ分類コードとを含むことは好適である。その場合、分類コードは分類コード付与部３１により付与されたものであってもよい。

【0057】

スコア値算出時期情報は、スコア値を算出する将来の時を特定する情報である。スコア値は、スコア値算出時期情報が特定する将来の時において、１以上の分類コードが付与された科学文献情報の創出内容を分類コードで表現した場合の確からしさを示す値である。スコア値は、例えば、スコア値算出時期情報が特定する将来の時において、１以上の分類コードが付与された科学文献情報が創出される確率である場合もあるが、確率情報に限らない。

【0058】

ここで、受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。

【0059】

各種の指示や情報等の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。受付部２は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。

【0060】

処理部３は、各種の処理を行う。各種の処理とは、例えば、学習部３０、分類コード予測部３１、検索部３２、時間間隔情報取得部３３、創出時予測部３４等が行う処理である。

【0061】

学習部３０は、学習処理を行い、学習器を取得し、当該学習器を学習器格納部１２に蓄積する。

【0062】

学習部３０は、例えば、１または２以上の分類コードに対応付く２以上の文書情報を用いて、機械学習のアルゴリズムにより、学習器を構成する。この学習器は、科学文献情報に基づく情報を入力として与えた場合に、少なくとも１以上の分類コードを出力する付与処理に使用される情報である。なお、文書情報は特許文書であり、分類コードはＩＰＣ分類コードであることは好適である。また、文書情報が学術論文であり、分類コードはＪＳＴ分類コードであることも好適である。

【0063】

また、ここでの機械学習は、例えば、深層学習、ＳＶＭ、決定木、ランダムフォレスト等が利用可能である。ただし、機械学習の種類は問わない。

【0064】

学習部３０は、２以上の各文書情報の一部または全部と、各文書情報に対応付く１以上の分類コードとの組を、２組以上、機械学習の関数（例えば、fastText、tensorflowのライブラリ、TinySVM）に与え、当該関数を動作させ、学習処理を行うことにより、学習器を構成し、当該学習器を学習器格納部１２に蓄積する。なお、学習処理は公知技術であるので、詳細な説明を省略する。

【0065】

分類コード付与部３１は、文献集合格納部１１の３以上の各科学文献情報に対して、学習器格納部１２の学習器を用いて、機械学習のアルゴリズムにより付与処理を行い、一の種類の１以上の分類コードを付与し、３以上の各科学文献情報に対応付ける。なお、付与処理は予測処理と言っても良い。分類コードの付与は、分類コードを取得することである、と考えても良い。

【0066】

分類コード付与部３１は、文献集合格納部１１の３以上の各科学文献情報に対して、学習器格納部１２の学習器を用いて、機械学習のアルゴリズムにより付与処理を行い、各科学文献情報に対して１以上のＩＰＣを付与し、当該１以上のＩＰＣを各科学文献情報に対応付けて蓄積することは好適である。

【0067】

なお、付与処理で使用する機械学習のアルゴリズムは問わない。機械学習のアルゴリズムは、例えば、深層学習、ＳＶＭ。決定木、ランダムフォレスト等が利用可能である。

【0068】

機械学習のアルゴリズムにより付与処理を行うことは、例えば、３以上の各科学文献情報と学習器とを機械学習の関数（例えば、fastText、TinySVM、tensorflowのライブラリ）に与え、当該関数を動作させることにより、各科学文献情報に対して一の種類の１以上の分類コードを取得することである。なお、分類コード予測部３１は、機械学習の関数を用いて、２以上の分類コードと、各分類コードに対応するスコア値とを取得した場合は、例えば、スコア値が予め決められた条件を満たすほど高い１以上の分類コードを選択して、取得しても良い。予め決められた条件を満たすほどスコアが値高いことは、例えば、スコア値が最大値であること、スコアが閾値以上または閾値より大きいこと等である。

【0069】

検索部３２は、例えば、検索情報に合致する分類コードに対応する３以上の科学文献情報を取得する。

【0070】

時間間隔情報取得部３３は、文献集合に含まれる３以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する２以上の時間間隔情報を取得する。時間間隔情報は、日数を示す情報でも良いし、月数を示す情報でも良いし、時間数を示す情報でも良い。

【0071】

時間間隔情報取得部３３は、着目する３以上の各科学文献情報に対応する創出時情報を文献集合格納部１１から取得する。そして、時間間隔情報取得部３３は、例えば、取得した３以上の創出時情報をソートする。次に、時間間隔情報取得部３３は、例えば、ソートされた３以上の創出時情報において、隣接する２つの創出時情報の差を算出し、当該差である時間間隔情報を取得する。

【0072】

または、時間間隔情報取得部３３は、創出時情報によりソートされている３以上の各科学文献情報から創出時情報を順に取得し、当該取得した３以上の創出時情報において、隣接する２つの創出時情報の差を算出し、当該差である時間間隔情報を取得する。

【0073】

創出時予測部３４は、時間間隔情報取得部３３が取得した２以上の時間間隔情報を用いて、将来創出時情報を取得する。

【0074】

将来創出時情報とは、文献集合の分野における将来の創出時に関する情報である。文献集合の分野とは、技術または科学の分野である。なお、創出時は公開時等と考えても良い。また、文献集合の分野は、例えば、分類コードにより特定される分野である。文献集合の分野は、例えば、検索情報により特定される分野である。将来創出時情報は、例えば、創作時を特定する創出時特定情報（例えば、創作日、創作月）である。また、将来創出時情報は、例えば、創出時特定情報とスコア値との組である創出時スコア情報である。スコア値は、創作内容を分類コードで表現した場合の確からしさを示す情報である。スコア値は、例えば、創出時特定情報が特定する時に創作される内容の分類コードの正しさの確率を示す確率情報である場合もあるが、確率情報に限らない。

【0075】

創出時予測部３４は、例えば、時間間隔情報取得部３３が取得した２以上の各時間間隔情報の平均値である平均時間間隔情報を取得し、最後の創出時情報が特定する時（例えば、最後の創作日）に平均時間間隔情報が示す時間（例えば、日数）を加算した時である将来創出時情報を取得する。

【0076】

また、創出時予測部３４は、例えば、時間間隔情報取得部３３が取得した２以上の各時間間隔情報の加重平均である加重平均時間間隔情報を取得し、最後の創出時情報が特定する時（例えば、最後の創作日）に平均時間間隔情報が示す時間（例えば、日数）を加算した時である将来創出時情報を取得する。なお、創出時予測部３４は、加重平均を算出する場合に、新しい時期の時間間隔情報の重みを古い時期の時間間隔情報の重みより大きくすることは好適である。

【0077】

また、創出時予測部３４は、例えば、分類コード付与部３１が科学文献情報に対して付与処理を行った場合に取得したスコア値と、当該科学文献情報に対応する創出時情報とを用いて、将来創出される科学文献のスコア値を取得しても良い。創出時予測部３４は、例えば、分類コード付与部３１が２以上の各科学文献情報に対して付与処理を行った際に付与した分類コードに対応するスコア値を取得する。

【0078】

具体的には、創出時予測部３４は、例えば、分類コード付与部３１が２以上の各科学文献情報に対して付与処理を行った際に取得したスコア値と２以上の各科学文献情報に対応する創出時情報との組を２組以上取得し、当該２組以上の情報を用いて、スコア値算出時期情報が特定する時のスコア値を予測し、予測値であるスコア値を取得する。なお、かかる処理は、例えば、公知の外挿の処理により実現され得る。また、外挿に用いる関数は問わない。なお、スコア値算出時期情報は、スコア値を算出する将来の時を特定する情報である。スコア値は、スコア値算出時期情報が特定する将来の時において、１以上の分類コードが付与された科学文献情報の創出内容を分類コードで表現した場合の確からしさを示す値である。スコア値は、例えば、スコア値算出時期情報が特定する将来の時において、１以上の分類コードが付与された科学文献情報が創出される確率である場合もあるが,確率情報に限らない。

【0079】

また、創出時予測部３４は、例えば、後述する間隔代表値情報取得手段３４１、後述するばらつき情報取得手段３４２、後述する判断手段３４３、後述する将来創出時情報取得手段３４４により、２以上の時間間隔情報を用いて、将来創出時情報を取得する。

【0080】

間隔代表値情報取得手段３４１は、２以上の各時間間隔情報の代表値である間隔代表値情報を取得する。間隔代表値情報とは、例えば、２以上の時間間隔情報の平均値である。また、間隔代表値情報とは、例えば、２以上の時間間隔情報の加重平均である。なお、間隔代表値情報取得手段３４１は、加重平均を算出する場合に、新しい時期の時間間隔情報の重みを古い時期の時間間隔情報の重みより大きくすることは好適である。また、間隔代表値情報取得手段３４１は、通常、時間間隔情報取得部３３が取得した２以上の時間間隔情報の代表値である間隔代表値情報を取得する。

【0081】

間隔代表値情報取得手段３４１は、例えば、一の種類の分類コードごとに、時間間隔情報取得部３３が取得した２以上の時間間隔情報の代表値である間隔代表値情報を取得する。ここでの分類コードは、１つでも良いし、２以上でも良い。

【0082】

間隔代表値情報取得手段３４１は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードおよび筆頭以外分類コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報の代表値である間隔代表値情報を取得する。なお、かかる２以上の時間間隔情報は、通常、時間間隔情報取得部３３が取得した情報である。

【0083】

間隔代表値情報取得手段３４１は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭のＩＰＣと筆頭以外のＩＰＣとに対応付けられている３以上の科学文献情報に対応付く創出時情報から取得された２以上の時間間隔情報の代表値である間隔代表値情報を取得することは好適である。

【0084】

間隔代表値情報取得手段３４１は、例えば、一の種類の２または３以上の分類コードごとに、２以上の時間間隔情報の代表値である間隔代表値情報を取得する。一の種類の２以上の分類コードとは、一の種類の筆頭分類コードおよび筆頭以外分類コードである。

【0085】

間隔代表値情報取得手段３４１は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の２または３以上の分類コードごとに、２以上の時間間隔情報の代表値である間隔代表値情報を取得する。一の種類の２以上の分類コードとは、一の種類の筆頭分類コードおよび筆頭以外分類コードである。

【0086】

間隔代表値情報取得手段３４１は、例えば、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報の代表値である間隔代表値情報を取得する。なお、分類コードがＩＰＣの「Ｇ０６Ｆ１７／３０」である場合、上位コードは、例えば、「Ｇ０６Ｆ１７／００」「Ｇ０６Ｆ１７／」「Ｇ０６Ｆ」「Ｇ０６」「Ｇ」である。

【0087】

間隔代表値情報取得手段３４１は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報の代表値である間隔代表値情報を取得する。

【0088】

間隔代表値情報取得手段３４１は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードごとに、２以上の時間間隔情報の代表値である間隔代表値情報を取得する。

【0089】

ばらつき情報取得手段３４２は、時間間隔情報取得部３３が取得した２以上の時間間隔情報のばらつきに関するばらつき情報を取得する。ばらつき情報は、例えば、２以上の時間間隔情報から取得されたＢＰＴ分布モデルにおける変動係数（α）である。また、ばらつき情報は、例えば、２以上の時間間隔情報から取得された分散、または標準偏差である。なお、変動係数、分散、標準偏差を算出する方法は、公知技術であるので詳細な説明は省略する。

【0090】

ばらつき情報取得手段３４２は、例えば、一の種類の分類コードごとに、２以上の時間間隔情報のばらつきに関するばらつき情報を取得する。ここでの分類コードは、１つでも良いし、２以上でも良い。

【0091】

ばらつき情報取得手段３４２は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードおよび筆頭以外分類コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報に対するばらつき情報を取得する。なお、かかる２以上の時間間隔情報は、通常、時間間隔情報取得部３３が取得した情報である。

【0092】

ばらつき情報取得手段３４２は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭のＩＰＣと筆頭以外のＩＰＣとに対応付けられている３以上の科学文献情報に対応付く創出時情報から取得された２以上の時間間隔情報に対するばらつき情報を取得する。

【0093】

ばらつき情報取得手段３４２は、例えば、一の種類の２または３以上の分類コードごとに、２以上の時間間隔情報に対するばらつき情報を取得する。

【0094】

ばらつき情報取得手段３４２は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の２または３以上の分類コードごとに、２以上の時間間隔情報に対するばらつき情報を取得する。

【0095】

ばらつき情報取得手段３４２は、例えば、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報に対するばらつき情報を取得する。

【0096】

ばらつき情報取得手段３４２は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する３以上の科学文献情報に対応付けられた３以上の創出時情報を用いて取得された２以上の時間間隔情報に対するばらつき情報を取得する。

【0097】

ばらつき情報取得手段３４２は、例えば、後述する判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードごとに、２以上の時間間隔情報に対するばらつき情報を取得する。

【0098】

判断手段３４３は、ばらつき情報取得手段３４２が取得したばらつき情報が特定するばらつきが、予め決められた条件を満たすほど、大きいか小さいかを判断する。予め決められた条件は、例えば、値であるばらつき情報が閾値以上であること、値であるばらつき情報が閾値より大きいこと等である。予め決められた条件は、例えば、変動係数（α）が０．５以上であること、または変動係数（α）が０．５より大きいことである。

【0099】

判断手段３４３は、終了条件に合致するか否かを判断する。上述したように、終了条件は、例えば、着目している分類コードに関する条件である。終了条件は、例えば、着目している分類コードの階層に関する条件である。終了条件は、例えば、着目している分類コードの階層が最上位の階層であることである。つまり、判断手段３４３は、例えば、着目している分類コードの階層が最上位の階層であることを判断する。また、判断手段３４３は、例えば、着目している分類コードの階層が最上位の階層であり、取得されたばらつき情報が閾値以上または閾値より大きい、と判断する。

【0100】

将来創出時情報取得手段３４４は、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する。

【0101】

将来創出時情報取得手段３４４は、例えば、一の種類の分類コードごとに、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する。

【0102】

将来創出時情報取得手段３４４は、通常、間隔代表値情報が先の時期を示す情報であればあるほど、先の時期を示す将来創出時情報を取得する。

【0103】

将来創出時情報取得手段３４４は、例えば、ばらつき情報が特定するばらつきが予めきめられた条件を満たすほど大きい場合に、将来創出時情報を取得しない、またはエラーメッセージを取得する。

【0104】

将来創出時情報取得手段３４４は、間隔代表値情報とばらつき情報とをＢＰＴ分布モデル又は対数正規分布モデルに適用し、将来創出時情報を取得することは好適である。なお、ＢＰＴ分布モデル、対数正規分布モデル、各モデルを用いた情報の取得については公知技術であるので、詳細な説明を省略する。

【0105】

将来創出時情報取得手段３４４は、例えば、間隔代表値情報とばらつき情報とをＢＰＴ分布モデル又は対数正規分布モデルに適用し、創出時特定情報とスコア値との組である創出時スコア情報を、１組または２組以上、取得する。将来創出時情報取得手段３４４は、一の種類の分類コードごとに、間隔代表値情報とばらつき情報とをＢＰＴ分布モデル又は対数正規分布モデルに適用し、将来創出時情報を取得することは好適である。

【0106】

将来創出時情報取得手段３４４は、例えば、間隔代表値情報をパラメータとする増加関数により将来創出時情報を取得する。

【0107】

将来創出時情報取得手段３４４は、例えば、判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭分類コードおよび筆頭以外分類コードに対応する間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。

【0108】

将来創出時情報取得手段３４４は、例えば、判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードおよび筆頭以外分類コードごとに、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。

【0109】

将来創出時情報取得手段３４４は、例えば、判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。

【0110】

将来創出時情報取得手段３４４は、例えば、判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードごとに、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。

【0111】

出力部４は、創出時予測部３４が取得した将来創出時情報を出力する。なお、出力部４が出力する将来創出時情報の構造等は問わない。将来創出時情報が２以上の創出時スコア情報である場合、出力部４は、例えば、創出時スコア情報が有する創出時特定情報を横軸、創出時スコア情報が有するスコア値を縦軸とするグラフである将来創出時情報を出力しても良い。また、将来創出時情報が創出時特定情報である場合、出力部４は、単に当該創出時特定情報を出力しても良い。

【0112】

出力部４は、判断手段３４３が、予め決められた条件を満たすほどばらつきが小さいと判断した場合に、将来創出時情報を出力することは好適である。

【0113】

出力部４は、例えば、判断手段３４３が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、エラーメッセージを出力することは好適である。また、出力部４は、例えば、判断手段３４３が終了条件に合致すると判断した場合、エラーメッセージを出力することは好適である。

【0114】

ここで、出力とは、ディスプレイへの表示であるが、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である、と考えても良い。

【0115】

格納部１、文献集合格納部１１、および学習器格納部１２は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

【0116】

格納部１等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部１等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部１等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部１等で記憶されるようになってもよい。

【0117】

処理部３、学習部３０、分類コード予測部３１、検索部３２、時間間隔情報取得部３３、および創出時予測部３４は、通常、ＭＰＵ、ＣＰＵ、ＧＰＵやメモリ等から実現され得る。処理部３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。

【0118】

出力部４は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部４は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

【0119】

次に、予測装置Ａが将来創出時情報を取得する処理の例について、図２のフローチャートを用いて説明する。

【0120】

（ステップＳ２０１）受付部２は、開始指示を受け付けたか否かを判断する。開始指示を受け付けた場合はステップＳ２０２に行き、開始指示を受け付けなかった場合はステップＳ２０１に戻る。

【0121】

（ステップＳ２０２）処理部３は、ステップＳ２０１で受け付けられた開始指示が検索情報を含むか否かを判断する。検索情報を含む場合はステップＳ２０３に行き、検索情報を含まない場合はステップＳ２０４に行く。

【0122】

（ステップＳ２０３）検索部３２は、ステップＳ２０１で受け付けられた開始指示に含まれる検索情報を用いて、文献集合格納部１１から３以上の科学文献情報を検索する。なお、ここで、検索部３２は、処理対象の科学文献情報を決定すれば良い。つまり、検索部３２は、科学文献情報を取得しても良いが、取得する必要はなく、科学文献情報のＩＤまたは科学文献情報に対応付く創出時情報等を取得しても良い。

【0123】

（ステップＳ２０４）検索部３２は、文献集合格納部１１に格納されている３以上の科学文献情報を、処理対象の科学文献情報として決定する。つまり、検索部３２は、３以上の科学文献情報、または３以上の科学文献情報のＩＤまたは３以上の科学文献情報に対応付く創出時情報等を文献集合格納部１１から取得する。

【0124】

（ステップＳ２０５）時間間隔情報取得部３３は、ステップＳ２０３またはステップＳ２０４で決定された３以上の科学文献情報または科学文献情報に対応する情報を用いて、２以上の時間間隔情報を取得する。かかる時間間隔情報取得処理の例について、図３のフローチャートを用いて説明する。

【0125】

（ステップＳ２０６）創出時予測部３４は、ステップＳ２０５で取得された２以上の時間間隔情報を用いて、創出時予測処理を行い、将来創出時情報を取得する。創出時予測処理の例について、図４のフローチャートを用いて説明する。

【0126】

（ステップＳ２０７）処理部３は、ステップＳ２０６で将来創出時情報を取得できたか否かを判断する。将来創出時情報を取得できた場合はステップＳ２０８に行き、将来創出時情報を取得できなかった場合はステップＳ２０９に行く。

【0127】

（ステップＳ２０８）創出時予測部３４は、ステップＳ２０６で取得された将来創出時情報を出力する。ステップＳ２０１に戻る。

【0128】

（ステップＳ２０９）創出時予測部３４は、格納部１からエラーメッセージを取得し、当該エラーメッセージを出力する。ステップＳ２０１に戻る。

【0129】

なお、図２のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

【0130】

次に、ステップＳ２０５の時間間隔情報取得処理の例について、図３のフローチャートを用いて説明する。

【0131】

（ステップＳ３０１）時間間隔情報取得部３３は、処理対象のすべての科学文献情報に対応付いている創出時情報を文献集合格納部１１から取得する。なお、処理対象の科学文献情報に対応付く共通の分類コードは、例えば、最下位の分類コード（例えば、「Ｇ０６Ｆ１７／３０」）である。

【0132】

（ステップＳ３０２）時間間隔情報取得部３３は、ステップＳ３０１で取得した創出時情報をソートする。なお、ソートは、時の古い順に行っても、時の新しい古い順に行っても良い。つまり、ソートは、昇順でも降順でも良い。

【0133】

（ステップＳ３０３）時間間隔情報取得部３３は、カウンタｉに２を代入する。

【0134】

（ステップＳ３０４）時間間隔情報取得部３３は、ステップＳ３０２でソートした結果の創出時情報の集合の中で、ｉ番目の創出時情報が存在するか否かを判断する。ｉ番目の創出時情報が存在する場合はステップＳ３０５に行き、存在しない場合は上位処理にリターンする。

【0135】

（ステップＳ３０５）時間間隔情報取得部３３は、ｉ番目の創出時情報と（ｉ－１）番目の創出時情報との差「創出時情報（ｉ）－創出時情報（ｉ－１）」である時間間隔情報を取得し、図示しないバッファに一時蓄積する。

【0136】

（ステップＳ３０６）時間間隔情報取得部３３は、カウンタｉを１、インクリメントする。ステップＳ３０４に戻る。

【0137】

次に、ステップＳ２０６の創出時予測処理の例について、図４のフローチャートを用いて説明する。

【0138】

（ステップＳ４０１）間隔代表値情報取得手段３４１は、図示しないバッファに存在するすべての時間間隔情報であり、２以上の時間間隔情報を取得し、当該２以上の時間間隔情報の代表値である間隔代表値情報（μ）を取得する。なお、間隔代表値情報（μ）は、例えば、２以上の時間間隔情報の平均値である。

【0139】

（ステップＳ４０２）ばらつき情報取得手段３４２は、図示しないバッファに存在する２以上の時間間隔情報を取得し、当該２以上の時間間隔情報を用いて、ばらつき情報（α）を取得する。なお、ばらつき情報（α）は、例えば、２以上の時間間隔情報の変動係数であり、具体的には、時間間隔情報のばらつきの標準偏差（σ）を、間隔代表値情報（μ）で除したものである。即ち、例えば、α＝σ／μである。

【0140】

（ステップＳ４０３）判断手段３４３は、ステップＳ４０２で取得されたばらつき情報（α）が予め決められた条件を満たすほど、ばらつきが少ないことを示す情報であるか否かを判断する。条件を満たす場合はステップＳ４０４に行き、条件を満たさない場合はステップＳ４０５に行く。なお、予め決められた条件は、例えば、「変動係数＜０．５」または「変動係数＜＝０．５」である。

【0141】

（ステップＳ４０４）将来創出時情報取得手段３４４は、間隔代表値情報（μ）とばらつき情報（α）とを用いて、将来創出時情報を取得する。上位処理にリターンする。

【0142】

（ステップＳ４０５）判断手段３４３は、終了条件に合致するか否かを判断する。終了条件に合致しない場合はステップＳ４０６に行き、終了条件に合致する場合は上位処理にリターンする。なお、終了条件は、格納部１に格納されている。終了条件は、例えば、着目する分類コードが最上位の分類コードであることである。

【0143】

（ステップＳ４０６）検索部３２は、使用する分類コードを変更する。分類コードの変更は、例えば、今まで着目していた筆頭分類コードに加えて、筆頭以外分類コードも含む２以上の分類コードに、着目する分類コードを変更し、かつ今まで着目していた筆頭分類コード（例えば、「Ｇ０６Ｆ１７／３０」）の階層を、一段、上位の階層の分類コード（例えば、「Ｇ０６Ｆ１７」「Ｇ０６Ｆ１７／００」）に変更することである。

【0144】

（ステップＳ４０７）検索部３２は、ステップＳ４０６で変更した分類コードに対応する３以上の科学文献情報を文献集合格納部１１から検索する。

【0145】

（ステップＳ４０８）時間間隔情報取得部３３は、ステップＳ４０７で検索された３以上の科学文献情報に対応する３以上の創出時情報を用いて、時間間隔情報を取得する。かかる時間間隔情報取得処理は、図３のフローチャートを用いて説明した。

【0146】

（ステップＳ４０９）創出時予測部３４は、創出時予測処理を行う。創出時予測処理は、図４のフローチャートにおける処理である。

【0147】

次に、予測装置Ａが学習器を構築する処理の例について、図５のフローチャートを用いて説明する。なお、ここでの学習処理は、特許情報を使用した学習処理の例である。

【0148】

（ステップＳ５０１）学習部３０は、カウンタｉに１を代入する。

【0149】

（ステップＳ５０２）学習部３０は、学習対象の特許情報の中で、ｉ番目の特許情報が存在するか否かを判断する。ｉ番目の特許情報が存在する場合はステップＳ５０３に行き、ｉ番目の特許情報が存在しない場合はステップＳ５０７に行く。

【0150】

（ステップＳ５０３）学習部３０は、ｉ番目の特許情報に対応付いている１以上の特許分類コードを取得する。なお、ここでの特許分類コードは、科学文献情報に対応付けたい特許分類コードであり、例えば、ＩＰＣである。また、ここで、取得される特許分類コードは、例えば、特許情報に対応付いているすべての特許分類コードであるが、筆頭分類コードのみでも良い。

【0151】

（ステップＳ５０４）学習部３０は、ｉ番目の特許情報の一部または全部を格納部１から取得する。なお、ここで取得する情報は、学習対象の情報である。

【0152】

（ステップＳ５０５）学習部３０は、ステップＳ５０４で取得したｉ番目の特許情報の一部または全部と、ステップＳ５０３で取得した１以上の特許分類コードとを対応付けて、図示しないバッファに一時蓄積する。

【0153】

（ステップＳ５０６）学習部３０は、カウンタｉを１、インクリメントする。ステップＳ５０２に戻る。

【0154】

（ステップＳ５０７）学習部３０は、図示しないバッファに一時蓄積されている、特許情報の一部または全部と１以上の特許分類コードとの組を、２組以上用いて、学習処理を行い、学習器を取得する。

【0155】

（ステップＳ５０８）学習部３０は、ステップＳ５０７で取得した学習器を学習器格納部１２に蓄積する。処理を終了する。

【0156】

次に、予測装置Ａが分類コードを科学文献情報に対応付ける処理の例について、図６のフローチャートを用いて説明する。

【0157】

（ステップＳ６０１）分類コード予測部３１は、学習器格納部１２から学習器を取得する。

【0158】

（ステップＳ６０２）分類コード予測部３１は、カウンタｉに１を代入する。

【0159】

（ステップＳ６０３）分類コード予測部３１は、分類コードを対応付ける対象のｉ番目の科学文献情報が存在するか否かを判断する。ｉ番目の科学文献情報が存在する場合はステップＳ６０４に行き、ｉ番目の科学文献情報が存在しない場合は上位処理にリターンする。

【0160】

（ステップＳ６０４）分類コード予測部３１は、ｉ番目の科学文献情報の中の情報であり、予測処理で使用する一部または全部の情報を文献集合格納部１１から取得する。

【0161】

（ステップＳ６０５）分類コード予測部３１は、ステップＳ６０４で取得したｉ番目の科学文献情報の一部または全部の情報を、ステップＳ６０１で取得した学習器に適用し、付与処理を行い、１以上の特許分類コードを取得する。

【0162】

なお、ここで、分類コード予測部３１は、１以上の各特許分類コードとスコア値とを取得することは好適である。そして、スコア値が条件を満たすほど高い（例えば、閾値以上または閾値より大きい）場合に、当該スコア値と対になる特許分類コードを取得することは好適である。また、分類コード予測部３１は、スコア値の高い順にソートすることは好適である。また、スコア値が最も高い分類コードは、筆頭分類コードである。

【0163】

（ステップＳ６０６）分類コード予測部３１は、ステップＳ６０５で取得した１以上の特許分類コードをｉ番目の科学文献情報に対応付ける。

【0164】

（ステップＳ６０７）分類コード予測部３１は、カウンタｉを１、インクリメントする。ステップＳ６０３に戻る。

【0165】

以下、本実施の形態における予測装置Ａにおける４つの実験例について説明する。

【0166】

実験１、実験２において、まず、過去２０年程度の論文である科学文献情報（６４５編）を準備し、予測装置Ａの格納部１に蓄積した。また、科学文献情報には、ＪＳＴ分類コードと論文の発表日（創出時情報）が対応付いている。なお、科学文献情報（６４５編）は、Ｋ大学のＫ教授を中心とするバイオ研究グループの論文である。また、科学文献情報（６４５編）は、“Journal of Bioscience and Bioengineering”、”Bioresource Technology“等の科学ジャーナルに掲載された学術論文、日本生物工学会の発表予稿集等である。

【0167】

なお、各科学文献情報に対して、機械学習（Deep Learning等）を用いて、ＩＰＣを対応付けた。なお、かかる処理には、予測装置Ａにおける学習部３０と分類コード付与部３１とを用いた。以上により、各科学文献情報には、元より付与されていたＪＳＴ分類コードと分類コード付与部により付与されたＩＰＣ分類コードとが対応付いた。

【0168】

そして、実験１、実験２において、間隔代表値情報は、論文の発表期間の平均値（μ）を用いた。つまり、間隔代表値情報取得手段３４１が、論文の発表期間の平均値（μ）を取得する。また、ばらつき情報は、論文の発表期間の変動件数（α）を用いた。つまり、ばらつき情報取得手段３４２は変動件数（α＝σ／μ、ここでσは時間間隔情報のばらつきの標準偏差）を取得する。そして、上記の予め決められた条件として、「変動件数（α）＜０．５」を用いた。また、将来創出時情報の取得のためのモデルとして、ＢＰＴ分布モデルを用いた。その理由は、ＢＰＴ分布モデルが適用されている地震発生予測と論文発表予測とに、以下に述べるアナロジーが存在するからである。即ち、地震発生には「ユーラシアプレートはフィリピン海プレートから常にプレッシャーを受け続け、一定の限界に達すると地震が発生することで一時的にプレッシャーから解放される」というサイクルが存在する。一方、論文発表にも「研究者は常に発表をしなければならないというプレッシャーを受け続け、一定の成果が蓄積すれば、それを論文として発表することで、一時的にプレッシャーから解放される」というサイクルが存在するからある。そしてＢＰＴ分布モデルは、一定のプレッシャーを受けつつ、行きつ戻りつする過程（例えば一定流速下でのブラウン運動）を記述できる理論であるからである。加えて、対数正規分布モデルも地震発生予測に用いられていることから、ＢＰＴ分布モデルと同様に論文発表予測に適用しうると考えられる。
（実験１）

【0169】

以上の前提の元、“Journal of Bioscience and Bioengineering”に掲載された「ＪＳＴ分類コード=FK03030L＊ＩＰＣ分類コード=C12P7」の検索情報に対応する科学文献情報に対して、予測装置Ａを動作させた。なお、ここで、使用する分類コードは、各科学文献情報に対応付く１以上の分類コードの中で、筆頭の分類コードのみである、とする。また、使用する分類コードは、最下位までの分類コード（ＪＳＴ分類コード=FK03030L：微生物代謝産物，ＩＰＣ分類コード=C12P7：酸素原子含有有機化合物）である、とする。

【0170】

すると、予測装置Ａは、論文の発表期間の平均値「μ＝２．１１年」、変動係数「α＝０．２９５」を得た。そして、予測装置Ａの判断手段３４３は、変動係数「α＝０．２９５」は条件「変動件数（α）＜０．５」を満たす、と判断する。

【0171】

そして、予測装置Ａの将来創出時情報取得手段３４４は、間隔代表値情報「μ＝２．１１年」とばらつき情報「α＝０．２９５」とをＢＰＴモデルに適用し、将来創出時情報を取得した。かかる将来創出時情報は、最後の論文発表日からの日数と確率の組の集合である。また、将来創出時情報取得手段３４４は、ここでは、今後１年間の論文発表確率をＹ軸とし、現時点からの経過年数ｔ（ｔ＜＝１年）をＸ軸とするグラフを構成した。なお計算式は、「長期的な地震発生確率の評価手法について」（平成１３年６月地震調査研究推進本部地震調査委員会）に詳細な説明がされている。さらに最近、ＢＰＴ分布モデル、対数正規分布モデルを含む各種の確率分布モデルの解説が、「地震発生の長期予測モデルについて」（２０１９年１月１２日：東北大学耐震工学研究会・柴田明徳東北大学名誉教授）によって公開されている。本発明における確率計算は、主に後者の文献に記載された方法によって行われている。

【0172】

そして、出力部４は、将来創出時情報取得手段３４４が構成したグラフを出力する。ここでのグラフは、図７である。

【0173】

図７において、７０１は論文最終発表から現時点までの経過年数が０．１年の場合の今後１年間の論文発表確率、７０２は０．２年の場合、７０３は０．３年の場合、７０４は０．４年の場合、７０５は０．５年の場合、７０６は０．６年の場合、７０７は４．０年の場合である。図７から、論文最終発表から現時点までの経過年数が０．２年の場合、今後１年間に当該分野における次の論文が発表される確率は０％から７３％に増加と予測されることが分かる。また論文最終発表から現時点までの経過年数が４．０年の場合、今後１年間に当該分野における次の論文が発表される確率は４２％から１００％までに増加と予測されることが分かる。
（実験２）

【0174】

実験１と掲載ジャーナルが”Bioresource Technology“であることを除いて、同じＪＳＴ分類コード、ＩＰＣ分類コードの前提の元、予測装置Ａを動作させた。なお、ここで、使用する分類コードは、各科学文献情報に対応付く１以上の分類コードの中で、まずは、筆頭分類コードだけである。

【0175】

そして、予測装置Ａを動作させた。すると、時間間隔情報取得部３３の時間間隔情報取得部３３は、筆頭分類コード「Ｃ１２Ｐ７」に対して、論文の発表期間を取得した。

【0176】

次に、予測装置Ａの間隔代表値情報取得手段３４１は、論文の発表期間の平均値「μ＝２１９日」を取得した。また、ばらつき情報取得手段３４２は、変動係数「α＝０．８１２」を取得した。かかる図は、図８である。図８において、論文発表間隔が強く揺動しているため、αの値が大きくなる。また、図８において、横軸は論文発表時（年）、縦軸はＩＰＣ「Ｃ１２Ｐ７」である。

【0177】

次に、予測装置Ａの判断手段３４３は、変動係数「α＝０．８１２」は条件「変動件数（α）＜０．５」を満たさない、と判断する。

【0178】

次に、予測装置Ａは、分類の階層構造を用いて、上位階層に移行して、論文発表間隔を取得する。つまり、予測装置Ａは、使用する分類コードを上位階層の分類コードに変更する。例えば、予測装置Ａは、「Ｃ１２Ｐ７」を「Ｃ１２Ｐ」に変更する。そして、時間間隔情報取得部３３は、上位階層の各分類コードごとに、論文の発表期間を取得した。

【0179】

また、ここで、予測装置Ａの処理部３は、１または２の発表しかない分類コードは、時間間隔が２以上取得できないため、ばらつきの計算ができず、除外することとした。なお、ここで、処理部３は、予め決められた条件を満たすほど少ない発表しかない分類コードを、処理対象から除外する、とする。つまり、予測装置Ａは、１または２の発表しかない分類コードである「Ｂ０９Ｂ」「Ｃ０８Ｂ」等を除外する。

【0180】

次に、時間間隔情報取得部３３は、除外された分類コードの除く、他のすべての各分類コードに対して、論文の発表期間を取得した。かかる図は、図９である。図９において、除外されなかった分類コードであり、上位階層の分類コードは、「Ｃ１２Ｎ」「Ｃ１２Ｐ」「Ｃ１２Ｒ」である。

【0181】

そして、予測装置Ａの間隔代表値情報取得手段３４１は、「Ｃ１２Ｎ」について論文の発表期間の平均値「μ＝７５１日」を取得した。また、ばらつき情報取得手段３４２は、変動係数「α＝０．３９９」を得た。また「Ｃ１２Ｒ」について論文の発表期間の平均値「μ＝７９２日」を取得した。また、ばらつき情報取得手段３４２は、変動係数「α＝０．５３９」を得た。

【0182】

次に、予測装置Ａの判断手段３４３は、「Ｃ１２Ｎ」について変動係数「α＝０．３９９」は条件「変動件数（α）＜０．５」を満たす、と判断する。また、「Ｃ１２Ｒ」について変動係数「α＝０．５３９」は「変動件数（α）＜０．５」を満たさない、と判断する。

【0183】

そして、予測装置Ａの将来創出時情報取得手段３４４は、「Ｃ１２Ｎ」について間隔代表値情報「μ＝７５１日」とばらつき情報「α＝０．３９９」とをＢＰＴモデルに適用し、将来創出時情報を取得した。かかる将来創出時情報は、最後の論文発表日からの日数と確率の組の集合である。また、将来創出時情報取得手段３４４は、ここでは、今後１年間の論文発表確率をＹ軸とし、現時点からの経過年数ｔ（ｔ＜＝１年）をＸ軸とするグラフを構成した。

【0184】

そして、出力部４は、将来創出時情報取得手段３４４が構成したグラフを出力する。ここでのグラフは、図１０である。

【0185】

図１０において、１００１は論文最終発表から現時点までの経過年数が０．１年の場合の今後１年間の論文発表確率、１００２は０．２年の場合、１００３は０．３年の場合、１００４は０．４年の場合、１００５は０．５年の場合、１００６は０．６年の場合、１００７は０．７年の場合、１００８は０．８年の場合、１００９は４．０年の場合である。図１０から、論文最終発表から現時点までの経過年数が０．８年の場合、今後１年間に当該分野における次の論文が発表される確率は１５％から９１％に増加と予測されることが分かる。
（実験３）

【0186】

実験３において、実験１における科学文献情報（ここでは論文）が６つ格納部１に格納されている、とする。そして、分類コード付与部３１により、６つの各論文において、分類コードとスコア値とが対応付けられた、とする。なお、対応付けられた分類コードは、「Ｃ１２Ｐ」「Ｃ１２Ｎ」の２つである、とする。また、６つの科学文献情報に対応付いている創出時情報は、「２００９／１２」「２０１２／６」「２０１４／２」「２０１５／３」「２０１７／１」「２０１９／２」である、とする。

【0187】

かかる場合、受付部２は、スコア値算出時期情報「現在から１年後」を受け付けた、とする。すると、創出時予測部３４は、まず、分類コード「Ｃ１２Ｐ」について、６つの各論文の創出時情報と、分類コード「Ｃ１２Ｐ」および論文に対応付くスコア値との組（以下、適宜、「組情報」と言う）を取得する。かかる６つの組情報は、図１１の「ＩＤ＝１」のレコードの属性値「組情報」の値である。組情報は、（創出時情報，スコア値）の構造である。そして、創出時予測部３４は、受付部２が受け付けたスコア値算出時期情報「現在から１年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「１．２年後」を取得する。次に、創出時予測部３４は、図１１の「ＩＤ＝１」の６つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「１．２年後」のスコア値「０．８３」を算出する。なお、かかるスコア値「０．８３」は、将来創出時情報の例である。

【0188】

次に、創出時予測部３４は、分類コード「Ｃ１２Ｎ」について、６つの各論文の創出時情報と、分類コード「Ｃ１２Ｎ」および論文に対応付くスコア値との組である組情報を取得する。かかる６つの組情報は、図１１の「ＩＤ＝２」のレコードの属性値「組情報」の値である。そして、創出時予測部３４は、受付部２が受け付けたスコア値算出時期情報「現在から１年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「１．２年後」を取得する。次に、創出時予測部３４は、図１１の「ＩＤ＝２」の６つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「１．２年後」のスコア値「０．０３」を算出する。なお、かかるスコア値「０．０３」は、将来創出時情報の例である。次に、出力部４は、創出時予測部３４が取得した将来創出時情報であるスコア値を出力する。ここで、出力部４は、例えば、分類コードごとに、図１２に示すようなグラフを出力する。図１２の１２０１は、分類コード「Ｃ１２Ｐ」のスコア値の推移と、現在から１年後の予測されたスコア値とを示すグラフである。また、１２０２は、分類コード「Ｃ１２Ｎ」のスコア値の推移と、現在から１年後の予測されたスコア値とを示すグラフである。
（実験４）

【0189】

実験４において、実験２における科学文献情報（ここでは論文）が４つ格納部１に格納されている、とする。そして、分類コード付与部３１により、４つの各論文において、分類コードとスコア値とが対応付けられた、とする。なお、対応付けられた分類コードは、「Ｃ１２Ｐ７」「Ｃ１２Ｎ１」の２つのである、とする。また、４つの科学文献情報に対応付いている創出時情報は、「２０１１／１１」「２０１４／１」「２０１７／１」「２０１８／１」である、とする。

【0190】

かかる場合、受付部２は、スコア値算出時期情報「現在から１年後」を受け付けた、とする。すると、創出時予測部３４は、まず、分類コード「Ｃ１２Ｐ７」について、４つの各論文の創出時情報と、分類コード「Ｃ１２Ｐ７」および論文に対応付くスコア値との組である組情報を取得する。かかる４つの組情報は、図１１の「ＩＤ＝３」のレコードの属性値「組情報」の値である。そして、創出時予測部３４は、受付部２が受け付けたスコア値算出時期情報「現在から１年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「１．８年後」を取得する。次に、創出時予測部３４は、図１１の「ＩＤ＝３」の４つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「１．８年後」のスコア値「０．８０」を算出する。なお、かかるスコア値「０．８０」は、将来創出時情報の例である。そして、創出時予測部３４は、受付部２が受け付けたスコア値算出時期情報「現在から１年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「１．８年後」を取得する。次に、創出時予測部３４は、分類コード「Ｃ１２Ｎ１」について、４つの各論文の創出時情報と、分類コード「Ｃ１２Ｎ１」および論文に対応付くスコア値との組である組情報を取得する。かかる４つの組情報は、図１１の「ＩＤ＝４」のレコードの属性値「組情報」の値である。
次に、創出時予測部３４は、図１１の「ＩＤ＝４」の４つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「１．８年後」のスコア値「０．０３」を算出する。なお、かかるスコア値「０．８０３」は、将来創出時情報の例である。

【0191】

次に、出力部４は、創出時予測部３４が取得した将来創出時情報であるスコア値を出力する。ここで、出力部４は、例えば、分類コードごとに、図１３に示すようなグラフを出力する。図１３の１３０１は、分類コード「Ｃ１２Ｐ７」のスコア値の推移と、スコア値算出時期情報「３０００」の時点の予測されたスコア値とを示すグラフである。また、１３０２は、分類コード「Ｃ１２Ｎ１」のスコア値の推移と、現在から１年後の時点の予測されたスコア値とを示すグラフである。

【0192】

以上、本実施の形態によれば、技術の将来の創出時に関する情報を取得できる。その結果、例えば、大学や研究機関等において、特許出願や産学連携等を担当する担当者が、適切な時期に研究者にコンタクトし、特許出願や産学連携等の研究支援を行うことできる。つまり、例えば、上記担当者が研究者にコンタクトし、研究支援を行おうとした際に、研究者が既に論文発表をしており、新規性を喪失し特許出願できない、または産学連携が上手く進められない、といったことを防止できる。またオープンイノベーションによる研究開発を行う場合、関係する多くの研究者の研究成果がどの段階で発表されるのかを、事前に予想することができるため、研究マネジメントを円滑に進めることができる。以上より、予測装置Ａに係る技術は、産学連携支援技術、研究支援技術と言っても良い。

【0193】

また、本実施の形態によれば、技術の将来の創出時に関するより適切な情報を取得しうる。

【0194】

また、本実施の形態によれば、ＪＳＴ分類コードと機械学習法等によって付与されたＩＰＣ分類コードを用いて、将来の論文発表日に関する情報を取得しうる。

【0195】

また、本実施の形態によれば、ＩＰＣ分類コードと機械学習法等によって付与されたＪＳＴ分類コードを用いて、特許出願日に関するより適切な情報を取得しうる。

【0196】

なお、本実施の形態における予測装置Ａは、学習機能等を有さなくても良い。つまり、予測装置Ａは、学習部３０、分類コード予測部３１を有さなくても良い。かかる場合、予測装置Ａの処理部３は、例えば、検索部３２、時間間隔情報取得部３３、および創出時予測部３４を備える。また、予測装置Ａの処理部３は、検索部３２を有さなくても良い。予測装置Ａの処理部３は、例えば、時間間隔情報取得部３３、および創出時予測部３４を備える。

【0197】

さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における予測装置Ａを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、１または２種類以上の分類コードと創出時を特定する創出時情報とに対応する３以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部にアクセス可能なコンピュータを、前記文献集合に含まれる３以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する２以上の時間間隔情報を取得する時間間隔情報取得部と、前記２以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、前記将来創出時情報を出力する出力部として機能させるためのプログラムである。

【0198】

また、図１１は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の予測装置Ａを実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図１１は、このコンピュータシステム３００の概観図であり、図１２は、システム３００のブロック図である。

【0199】

図１１において、コンピュータシステム３００は、ＣＤ－ＲＯＭドライブを含むコンピュータ３０１と、キーボード３０２と、マウス３０３と、モニタ３０４とを含む。

【0200】

図１２において、コンピュータ３０１は、ＣＤ－ＲＯＭドライブ３０１２に加えて、ＭＰＵ３０１３と、ＣＤ－ＲＯＭドライブ３０１２等に接続されたバス３０１４と、ブートアッププログラム等のプログラムを記憶するためのＲＯＭ３０１５と、ＭＰＵ３０１３に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのＲＡＭ３０１６と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク３０１７とを含む。ここでは、図示しないが、コンピュータ３０１は、さらに、ＬＡＮへの接続を提供するネットワークカードを含んでも良い。

【0201】

コンピュータシステム３００に、上述した実施の形態の予測装置Ａの機能を実行させるプログラムは、ＣＤ－ＲＯＭ３１０１に記憶されて、ＣＤ－ＲＯＭドライブ３０１２に挿入され、さらにハードディスク３０１７に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ３０１に送信され、ハードディスク３０１７に記憶されても良い。プログラムは実行の際にＲＡＭ３０１６にロードされる。プログラムは、ＣＤ－ＲＯＭ３１０１またはネットワークから直接、ロードされても良い。

【0202】

プログラムは、コンピュータ３０１に、上述した実施の形態の予測装置Ａの機能を実行させるオペレーティングシステム（ＯＳ）、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能（モジュール）を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム３００がどのように動作するかは周知であり、詳細な説明は省略する。

【0203】

なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理（ハードウェアでしか行われない処理）は含まれない。

【0204】

また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。

【0205】

また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。つまり、予測装置Ａは、サーバとして機能しても良い。かかる場合、受付部２は、図示しない端末装置から開始指示等を受信する。また、出力部４は、図示しない端末装置に将来創出時情報を送信する。また、予測装置Ａがサーバである場合、当該サーバは、いわゆるクラウドサーバ、ＡＳＰサーバ等、問わない。

【0206】

本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

【産業上の利用可能性】

【0207】

以上のように、本発明にかかる予測装置は、技術の将来の創出時に関する情報を取得できるという効果を有し、予測装置等として有用である。

【符号の説明】

【0208】

Ａ予測装置
１格納部
２受付部
３処理部
４出力部
１１文献集合格納部
１２学習器格納部
３０学習部
３１分類コード予測部
３２検索部
３３時間間隔情報取得部
３４創出時予測部
３４１間隔代表値情報取得手段
３４２情報取得手段
３４３判断手段
３４４将来創出時情報取得手段

【図1】