IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 開本 亮の特許一覧

<>
  • 特許-予測装置、予測方法、およびプログラム 図1
  • 特許-予測装置、予測方法、およびプログラム 図2
  • 特許-予測装置、予測方法、およびプログラム 図3
  • 特許-予測装置、予測方法、およびプログラム 図4
  • 特許-予測装置、予測方法、およびプログラム 図5
  • 特許-予測装置、予測方法、およびプログラム 図6
  • 特許-予測装置、予測方法、およびプログラム 図7
  • 特許-予測装置、予測方法、およびプログラム 図8
  • 特許-予測装置、予測方法、およびプログラム 図9
  • 特許-予測装置、予測方法、およびプログラム 図10
  • 特許-予測装置、予測方法、およびプログラム 図11
  • 特許-予測装置、予測方法、およびプログラム 図12
  • 特許-予測装置、予測方法、およびプログラム 図13
  • 特許-予測装置、予測方法、およびプログラム 図14
  • 特許-予測装置、予測方法、およびプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-03
(45)【発行日】2024-04-11
(54)【発明の名称】予測装置、予測方法、およびプログラム
(51)【国際特許分類】
   G06F 16/903 20190101AFI20240404BHJP
【FI】
G06F16/903
【請求項の数】 9
(21)【出願番号】P 2019191726
(22)【出願日】2019-10-21
(65)【公開番号】P2021068080
(43)【公開日】2021-04-30
【審査請求日】2022-08-29
(73)【特許権者】
【識別番号】524046250
【氏名又は名称】開本 亮
(74)【代理人】
【識別番号】100115749
【弁理士】
【氏名又は名称】谷川 英和
(72)【発明者】
【氏名】開本 亮
【審査官】成瀬 博之
(56)【参考文献】
【文献】韓国公開特許第10-2016-0050729(KR,A)
【文献】特開2007-086986(JP,A)
【文献】特開2005-301389(JP,A)
【文献】国際公開第2005/041096(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
創出時を特定する創出時情報に対応する3以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部と、
前記文献集合に含まれる3以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する2以上の時間間隔情報を取得する時間間隔情報取得部と、
前記2以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、
前記将来創出時情報を出力する出力部とを具備し、
前記創出時予測部は、
前記時間間隔情報取得部が取得した2以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得手段と、
前記時間間隔情報取得部が取得した2以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得手段と、
前記間隔代表値情報と前記ばらつき情報とをBPT分布モデル又は対数正規分布モデルに適用し、前記将来創出時情報を取得する将来創出時情報取得手段とを具備する予測装置。
【請求項2】
前記創出時予測部は、
前記ばらつき情報取得手段が取得したばらつき情報が特定するばらつきが、予め決められた条件を満たすほど、大きいか小さいかを判断する判断手段をさらに具備し、
前記出力部は、
前記判断手段が、予め決められた条件を満たすほどばらつきが小さいと判断した場合に、前記将来創出時情報を出力する請求項1記載の予測装置。
【請求項3】
前記文献集合格納部の前記3以上の各科学文献情報は、1または2種類以上の分類コードに対応し、
少なくとも一の種類の分類コードは2階層以上に階層化されたコードであり、下位のコードよりも上位のコードである上位コードを有するコードであり、
前記文献集合格納部の3以上のいずれかの科学文献情報には、前記少なくとも一の種類の分類コードについて、筆頭分類コードに加えて筆頭以外分類コードが対応付いており、
前記間隔代表値情報取得手段は、
前記判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、前記一の種類の筆頭分類コードを含む上位コードおよび筆頭以外分類コードを含む上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報の代表値である間隔代表値情報を取得し、
前記ばらつき情報取得手段は、
前記判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、前記一の種類の筆頭分類コードを含む上位コードおよび筆頭以外分類コードを含む上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報に対するばらつき情報を取得し、
前記将来創出時情報取得手段は、
前記判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、前記間隔代表値情報と前記ばらつき情報とを用いて、前記将来創出時情報を取得する請求項2記載の予測装置。
【請求項4】
少なくとも一の種類の1以上の分類コードに対応付けられた2以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された学習器が格納される学習器格納部と、
前記文献集合格納部の3以上の各科学文献情報に対して、前記学習器を用いて、機械学習のアルゴリズムにより、前記一の種類の1以上の分類コードを付与し、前記3以上の各科学文献情報に対応付ける分類コード付与部とをさらに具備する請求項3記載の予測装置。
【請求項5】
前記科学文献情報は、学術論文の情報であり、
前記1または2種類以上の分類コードのうちの一の種類が前記分類コード付与部が付与したIPC分類コードであり、
前記創出時情報は、論文発表日を特定する情報である請求項4記載の予測装置。
【請求項6】
前記科学文献情報は、特許出願の情報であり、
前記1または2種類以上の分類コードのうちの一の種類が前記分類コード付与部が付与したJST分類コードであり、
前記創出時情報は、特許出願日を特定する情報である請求項4記載の予測装置。
【請求項7】
分類コードを用いた検索情報を受け付ける受付部と、
前記検索情報に合致する分類コードに対応する3以上の科学文献情報を取得する検索部とをさらに具備し、
前記文献集合格納部に格納されている3以上の科学文献情報は、前記検索部が取得した科学文献情報である請求項1から請求項6いずれか一項に記載の予測装置。
【請求項8】
創出時を特定する創出時情報に対応する3以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部と、時間間隔情報取得部と、創出時予測部と、出力部とを具備する予測装置により実現される予測方法であって、
前記時間間隔情報取得部が、前記文献集合に含まれる3以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する2以上の時間間隔情報を取得する時間間隔情報取得ステップと、
前記創出時予測部が、前記2以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測ステップと、
前記出力部が、前記将来創出時情報を出力する出力ステップとを具備し、
前記創出時予測ステップは、
前記時間間隔情報取得部が取得した2以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得サブステップと、
前記時間間隔情報取得部が取得した2以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得サブステップと、
前記間隔代表値情報と前記ばらつき情報とをBPT分布モデル又は対数正規分布モデルに適用し、前記将来創出時情報を取得する将来創出時情報取得サブステップとを具備する予測方法。
【請求項9】
創出時を特定する創出時情報に対応する3以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部にアクセス可能なコンピュータを、
前記文献集合に含まれる3以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する2以上の時間間隔情報を取得する時間間隔情報取得部と、
前記2以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、
前記将来創出時情報を出力する出力部として機能させるためのプログラムであって
前記創出時予測部は、
前記時間間隔情報取得部が取得した2以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得手段と、
前記時間間隔情報取得部が取得した2以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得手段と、
前記間隔代表値情報と前記ばらつき情報とをBPT分布モデル又は対数正規分布モデルに適用し、前記将来創出時情報を取得する将来創出時情報取得手段とを具備するものとして、前記コンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、科学文献等の将来の創出時に関する情報を取得し、出力する予測装置等に関するものである。
【背景技術】
【0002】
従来、予測対象論文が出版されてから短期間のデータのみを用いて、萌芽領域の予測結果を得る技術があった(例えば、特許文献1参照)。
【0003】
本技術は、萌芽論文の予測のための方法であって、予測モデルを構築するステップ、構築された予測モデルを評価するステップ、及び構築された予測モデルを用いて予測を行うステップを含み、予測モデルを構築するステップは、データベースから論文データを取得するステップ、取得した論文データから論文の書誌情報及び引用ネットワークを抽出するステップ、抽出した論文の書誌情報及び引用ネットワークから論文の各特徴量を算出するステップ、並びに算出された各特徴量を説明変数とし萌芽論文を被説明変数として教師ありクラス分類を行なうステップを含み、前記予測モデルを構築するステップにおいて算出される特徴量には、著者名、著者特徴量、論文誌名、及び論文誌特徴量を含まず、構築された予測モデルを評価するステップは、被予測萌芽論文の論文データ及び被予測萌芽論文が公表された日が属する一定期間に公表された論文の論文データをデータベースから取得するステップ、並びに構築された予測モデルを評価指標で評価するステップを含み、構築されたモデルを用いて予測を行うステップは、予測の対象とする論文の論文データをデータベースから取得するステップ、及び予測の対象とする論文が萌芽論文であるか否かを予測するステップを含む、萌芽領域の予測方法である。
【0004】
また、従来、学術論文を国際特許分類(IPC)に対応付ける技術があった(例えば、非特許文献1参照)。なお、IPCは、適宜、IPC分類コードとも言う。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2017-174357号公報
【非特許文献】
【0006】
【文献】難波英嗣、外3名、“学術論文の国際特許分類への自動分類”、[online]、Japio 2008 YEAR BOOK、[令和1年10月4日検索]、インターネット[URL:http://www.japio.or.jp/00yearbook/files/2008book/08_4_04.pdf#search=%27%E9%9B%A3%E6%B3%A2%E8%8B%B1%E5%97%A3+%E8%AB%96%E6%96%87+%EF%BC%A9%EF%BC%B0%EF%BC%A3%E4%BB%98%E4%B8%8E%27]
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来技術においては、技術の将来の創出時に関する情報を取得できなかった。なお、技術の創出とは、ここでは、例えば、科学文献等の創出である。科学文献等の創出は、例えば、科学文献等の発表である。
【0008】
その結果、例えば、大学や研究機関等において、特許出願や産学連携等を担当する担当者が、適切な時期に研究者にコンタクトし、科学文献等の創出前ドラフトを、特許出願や産学連携等の対象として研究支援を行うことが理想的ではあるが、コンタクトのタイミングを見計らうことは容易ではなかった。つまり、例えば、上記担当者が研究者へのコンタクトが遅すぎた場合、研究支援を行おうとした際には、研究者が、既に論文発表をしており、新規性を喪失し特許出願できない、または産学連携が上手く進められない、といったことも起こり得た。一方、早すぎた場合、支援対象が具体化されておらず、反って研究者の時間を取ってしまうことにも繋がっていた。またオープンイノベーションによる研究開発を行う場合、関係する多くの研究者の研究成果がどの段階で発表されるのかを、事前に予想することは従来できなかったため、研究マネジメントを円滑に進めることが難しかった。
【課題を解決するための手段】
【0009】
本第一の発明の予測装置は、1または2種類以上の分類コードと創出時を特定する創出時情報とに対応する3以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部と、文献集合に含まれる3以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する2以上の時間間隔情報を取得する時間間隔情報取得部と、2以上の時間間隔情報を用いて、文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、将来創出時情報を出力する出力部とを具備する予測装置である。
【0010】
かかる構成により、技術の将来の創出時に関する情報を取得しうる。
【0011】
また、本第二の発明の予測装置は、第一の発明に対して、少なくとも一の種類の1以上の分類コードに対応付けられた2以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された学習器が格納される学習器格納部と、文献集合格納部の3以上の各科学文献情報に対して、学習器を用いて、機械学習のアルゴリズムにより、一の種類の1以上の分類コードを付与し、3以上の各科学文献情報に対応付ける分類コード付与部とをさらに具備する予測装置である。
【0012】
かかる構成により、技術の将来の創出時に関する情報を取得できる。
【0013】
また、本第三の発明の予測装置は、第一または第二の発明に対して、創出時予測部は、時間間隔情報取得部が取得した2以上の時間間隔情報の代表値である間隔代表値情報を取得する間隔代表値情報取得手段と、時間間隔情報取得部が取得した2以上の時間間隔情報のばらつきに関するばらつき情報を取得するばらつき情報取得手段と、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する将来創出時情報取得手段とを具備する予測装置である。
【0014】
かかる構成により、技術の将来の創出時に関する適切な情報を取得できる。
【0015】
また、本第四の発明の予測装置は、第三の発明に対して、将来創出時情報取得手段は、間隔代表値情報とばらつき情報とをBPT分布モデル又は対数正規分布モデルに適用し、将来創出時情報を取得する予測装置である。
【0016】
かかる構成により、技術の将来の創出時に関する適切な情報を取得できる。
【0017】
また、本第五の発明の予測装置は、第三または第四の発明に対して、創出時予測部は、ばらつき情報取得手段が取得したばらつき情報が特定するばらつきが、予め決められた条件を満たすほど、大きいか小さいかを判断する判断手段をさらに具備し、出力部は、判断手段が、予め決められた条件を満たすほどばらつきが小さいと判断した場合に、将来創出時情報を出力する予測装置である。
【0018】
かかる構成により、技術の将来の創出時に関するより適切な情報を取得できる。
【0019】
また、本第六の発明の予測装置は、第五の発明に対して、少なくとも一の種類の分類コードは2階層以上に階層化されたコードであり、下位のコードよりも上位のコードである上位コードを有するコードであり、文献集合格納部の3以上のいずれかの科学文献情報には、少なくとも一の種類の分類コードについて、筆頭分類コードに加えて筆頭以外分類コードが対応付いており、間隔代表値情報取得手段は、判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報の代表値である間隔代表値情報を取得し、ばらつき情報取得手段は、判断手段が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報に対するばらつき情報を取得し、将来創出時情報取得手段は、判断手段が、予め決められた条件を満たすほどばらつきが小さいと判断した場合、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する予測装置である。
【0020】
かかる構成により、技術の将来の創出時に関するより適切な情報を取得できる。
【0021】
また、本第七の発明の予測装置は、分類コードと創出時情報とに対応する3以上の科学文献情報の集合である文献集合が格納される文献集合格納部と、分類コードに対応付けられた2以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された学習器が格納される学習器格納部と、文献集合格納部の3以上の各科学文献情報に対して、学習器を用いて、機械学習のアルゴリズムにより、1以上の分類コードを付与し、3以上の各科学文献情報に対応付け、かつ1以上の各分類コードに対応するスコア値を取得する分類コード付与部と、1以上の各分類コードごとに、分類コード付与部が科学文献情報に対して付与処理を行った場合に取得したスコア値と、当該科学文献情報に対応する創出時情報とを用いて、将来の時におけるスコア値を含む将来創出時情報を取得する創出時予測部と、将来創出時情報を出力する出力部とを具備する予測装置である。
【0022】
かかる構成により、将来に創出される技術分野に関する情報を得ることができる。 また、本第八の発明の予測装置は、第一から第七いずれか1つの発明に対して、科学文献情報は、学術論文の情報であり、1または2種類以上の分類コードのうちの一の種類が分類コード付与部が付与したIPC分類コードであり、創出時情報は、論文発表日を特定する情報である予測装置である。
【0023】
かかる構成により、IPC分類コードを用いて、将来の論文発表日に関する情報を取得できる。
【0024】
また、本第九の発明の予測装置は、第一から第七いずれか1つの発明に対して、科学文献情報は、特許出願の情報であり、1または2種類以上の分類コードのうちの一の種類が分類コード付与部が付与したJST分類コードであり、創出時情報は、特許出願日を特定する情報である予測装置である。
【0025】
かかる構成により、JST分類コードを用いて、特許出願日に関するより適切な情報を取得できる。
【0026】
また、本第十の発明の予測装置は、第一から第九いずれか1つの発明に対して、分類コードを用いた検索情報を受け付ける受付部と、検索情報に合致する分類コードに対応する3以上の科学文献情報を取得する検索部とをさらに具備し、文献集合格納部に格納されている3以上の科学文献情報は、検索部が取得した科学文献情報である予測装置である。
【0027】
かかる構成により、受け付けた検索情報に合致する科学文献情報の分野における、技術の将来の創出時に関するより適切な情報を取得できる。
【発明の効果】
【0028】
本発明による予測装置によれば、技術の将来の創出時に関する情報を取得できる。
【図面の簡単な説明】
【0029】
図1】実施の形態1における予測装置Aのブロック図
図2】同予測装置Aが将来創出時情報を取得する処理の例について説明するフローチャート
図3】同時間間隔情報取得処理の例について説明するフローチャート
図4】同創出時予測処理の例について説明するフローチャート
図5】同予測装置Aが学習器を構築する処理の例について説明するフローチャート
図6】同予測装置Aが分類コードを科学文献情報に対応付ける処理の例について説明するフローチャート
図7】同出力例を示す図
図8】同論文発表間隔に関して表示する図
図9】同論文発表間隔に関して表示する図
図10】同出力例を示す図
図11】同スコア値取得のための元情報を管理する表を示す図
図12】同出力例を示す図
図13】同出力例を示す図
図14】同コンピュータシステムの概観図
図15】同コンピュータシステムのブロック図
【発明を実施するための形態】
【0030】
以下、予測装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0031】
(実施の形態1)
本実施の形態において、1または2種類以上の分類コードと、創出時に関する創出時情報とに対応する3以上の科学文献情報が格納されており、当該2以上の各科学文献情報に対応する創出時情報を用いて、時間間隔を特定する2以上の時間間隔情報を用いて、当該分類コードに対応する論文の将来の創出時に関する将来創出時情報を取得し、出力する予測装置について説明する。なお、本実施の形態において、1または2種類以上の分類コードは、例えば、後述するように、機械学習のアルゴリズムにより自動付与される。
【0032】
また、本実施の形態において、取得した2以上の時間間隔情報を用いて、一の種類の分類コードごとに、時間間隔情報の代表値である間隔代表値情報(μ)(例えば、時間間隔の平均値)と、時間間隔情報のばらつきに関するばらつき情報(α)(例えば、変動係数)とを取得し、当該間隔代表値情報と当該ばらつき情報とを用いて将来創出時情報を取得する予測装置について説明する。
【0033】
また、本実施の形態において、予測装置は、例えば、間隔代表値情報とばらつき情報に対して、BPT分布モデル又は対数正規分布モデルを適用することにより将来創出時情報を取得する。
【0034】
また、本実施の形態において、例えば、ばらつき情報が予め決められた条件を満たす場合に、将来創出時情報を取得し、出力する予測装置について説明する。
【0035】
また、本実施の形態において、例えば、科学文献情報には、筆頭分類コードに加えて筆頭以外分類コードが付与されている科学文献情報があり、予め決められた条件を満たさない場合、筆頭以外分類コードをも用いて、一の種類の分類コードごとに、間隔代表値情報とばらつき情報とを取得し、ばらつき情報が予め決められた条件を満たす分類コードに対して、将来創出時情報を取得し、出力する予測装置について説明する。なお、予め決められた条件は、通常、ばらつきが小さいことである。
【0036】
また、本実施の形態において、科学文献情報には、筆頭分類コードに加えて筆頭以外分類コードが付与され得、かつ分類コードは階層化されており、下位の筆頭分類コードでは、ばらつき情報が予め決められた条件を満たさない場合、例えば、筆頭以外分類コードをも用いて、かつ下位より上位の分類コードを用いて、上位分類コードごとに、間隔代表値情報とばらつき情報とを取得し、ばらつき情報が予め決められた条件を満たす分類コードに対して、将来創出時情報を取得し、出力する予測装置について説明する。
【0037】
また、本実施の形態において、分類コードに対して、特定の時に発表されるスコア値を取得する予測装置について説明する。
【0038】
なお、本実施の形態において、例えば、科学文献情報が学術論文であり、一の種類の分類コードが分類コード付与部が付与した国際特許分類コード(以下、適宜、IPC分類コード、IPCとも言う。)であり、創出時情報が論文発表日を特定する情報である。また、本実施の形態において、例えば、科学文献情報が特許出願書類であり、一の種類の分類コードが分類コード付与部が付与したJST分類コードであり、創出時情報が特許出願日を特定する情報である。分類コードは、階層化されている情報であることは好適である。また、科学文献情報に対応する分類コードは、2以上でも良い。また、科学文献情報に2以上の分類コードが対応付いている場合、当該2以上の分類コードのうちの一の分類コードは筆頭の分類コードであり、他の分類コードは筆頭以外分類コードであることは好適である。
【0039】
さらに、本実施の形態において、分類コードを含む検索情報を受け付け、当該検索情報に対応する2以上の科学文献情報である部分集合情報を決定する予測装置について説明する。
【0040】
図1は、本実施の形態における予測装置Aのブロック図である。
【0041】
予測装置Aは、格納部1、受付部2、処理部3、および出力部4を備える。格納部1は、例えば、文献集合格納部11、および学習器格納部12を備える。処理部3は、例えば、学習部30、分類コード付与部31、検索部32、時間間隔情報取得部33、および創出時予測部34を備える。創出時予測部34は、例えば、間隔代表値情報取得手段341、ばらつき情報取得手段342、判断手段343、および将来創出時情報取得手段344を備える。
【0042】
なお、予測装置Aの処理部3は、学習部30と分類コード付与部31とを含まなくても良い。かかる場合、自動的に分類コードを付与することが行われない、または図示しない他の装置により学習部30と分類コード付与部31との処理が行われる。
【0043】
格納部1には、各種の情報が格納される。各種の情報とは、例えば、後述する文献集合、後述する学習器、予め決められた条件、終了条件、2以上の特許情報、エラーメッセージである。
【0044】
予め決められた条件は、後述するばらつきに関する条件である。予め決められた条件は、ばらつき情報に関する条件である。予め決められた条件は、ばらつきが小さいことを特定する条件である。予め決められた条件は、例えば、ばらつき情報が閾値以下または閾値未満であることである。なお、ばらつき情報は、例えば、後述するBPT分布モデルにおける変動係数が好適であるが、分散、標準偏差等、ばらつきを特定する情報であれば良い。
【0045】
終了条件は、創出時予測処理の終了のための条件である。終了条件は、例えば、着目している分類コードに関する条件である。終了条件は、例えば、着目している分類コードの階層に関する条件である。終了条件は、例えば、着目している分類コードの階層が予め決められた階層であること、着目している分類コードの階層が最上位の階層であること、着目している分類コードの階層が最上位から下に2番目の階層であること、着目している分類コードが筆頭以外分類コードも含んでいること等である。終了条件は、例えば、ばらつき情報に関する条件でも良い。終了条件は、例えば、着目している分類コードとばらつき情報とに関する条件でも良い。終了条件は、例えば、着目している分類コードの階層が予め決められた階層であり、かつばらつき情報が閾値以上または閾値より大きいことである。なお、着目している分類コードとは、処理に使用している分類コードと言っても良い。着目している分類コードは、筆頭分類コードが好適であるが、筆頭分類コードと1以上の筆頭以外分類コードでも良く、1以上の筆頭以外分類コードでも良い。
【0046】
特許情報は、通常、特許明細書、特許請求の範囲、要約書のうちの1以上の情報を含む。特許情報は、公開特許公報、登録特許公報でも良い。
【0047】
格納部1の3以上の各特許情報は、1または2種類以上の分類コードに対応付いている。ここでの分類コードは、特許分類コードである。特許分類コードの種類は、例えば、IPC、FI、Fターム、CPCである。また、3以上の各特許情報は、一の種類の1または2以上の特許分類コードに対応付いている。ここでの1以上の特許分類コードのうちの一の特許分類コードは筆頭分類コードであり、他の特許分類コードは筆頭以外分類コードである。
【0048】
文献集合格納部11には、文献集合が格納される。文献集合は、3以上の科学文献情報の集合である。文献集合は、通常、処理対象の3以上の科学文献情報の集合である。科学文献情報とは、科学または技術等に関する文献の情報である。科学文献情報は、例えば、学術論文の情報、科学文献情報、特許情報である。科学文献情報は、例えば、ファイル、データベースのレコード等であるが、そのデータ構造は問わない。
【0049】
また、科学文献情報には、1または2種類以上の分類コードと創出時情報とが対応付いている。情報Aに情報Bが対応付くことは、情報Aから情報Bを取得できれば足りる。情報Aに情報Bが対応付くことは、例えば、情報Aと情報Bとがリンク付いていること、情報Aと情報Bとが同一のファイル内に存在すること、情報Aと情報Bとが同一のレコード内に存在すること、情報Aが情報Bを含むこと等である。
【0050】
科学文献情報に対応付く分類コードは、科学文献情報を分類するための情報である。分類コードは、例えば、JST分類コード、特許分類コードである。JST分類コードについては、例えば、URL「http://t21help.nikkei.co.jp/reference/docs/JD3_sousa.pdf」に記載されている説明を参照のこと。また、特許分類コードは、例えば、IPC、Fターム、FI、CPC等である。なお、科学文献情報にJST分類コードが対応付いている状況において、後述する分類コード付与部31により、特許分類コードが自動的に対応付けられることは好適である。なお、自動的に対応付けられる特許分類コードは、例えば、IPCである。
【0051】
創出時情報とは、創出時を特定する情報である。創出時とは、公開日でも良い。つまり、創出とは、ここでは公開でも良い。創出時情報は、例えば、論文発表日、ウェブページへの掲載日、特許出願日等である。
【0052】
エラーメッセージは、例えば、将来創出時情報を取得できなかった旨の情報、将来創出時を予測することが困難であることを示す情報、エラーコード(例えば、「-1」)等である。
【0053】
学習器格納部12には、学習器が格納される。学習器は、後述する学習部30が作成した情報である。学習器は、科学文献情報に基づく情報を入力とし、1または2以上の分類コードを出力とするための情報である。科学文献情報に基づく情報とは、科学文献情報の全部または一部、または科学文献情報を加工した情報である。学習器は、例えば、一の種類の1以上の分類コードに対応付けられた2以上の科学文献情報である教師データを機械学習のアルゴリズムにより学習し、作成された情報である。学習器を作成する学習部30の詳細については後述する。
【0054】
受付部2は、各種の指示や情報等を受け付ける。各種の指示や情報等は、例えば、開始指示、分類コードを用いた検索情報、スコア値算出時期情報である。
【0055】
開始指示は、将来創出時情報を出力する動作の開始指示である。開始指示は、検索情報を含むことは好適である。
【0056】
検索情報は、処理対象の科学文献情報を決定するための条件の情報である。検索情報は、例えば、検索式、検索モジュールである。検索式は、例えば、SQL等で記載されているが、その記載方法やデータ構造等は問わない。検索情報は、一の種類の1または2以上の分類コードを含むことは好適である。検索情報が含む1以上の分類コードの中には、1つの筆頭分類コードと1以上の筆頭以外分類コードが存在することは好適である。また、検索情報は、2以上の種類の分類コードを含んでも良い。検索情報は、IPC分類コードとJST分類コードとを含むことは好適である。その場合、分類コードは分類コード付与部31により付与されたものであってもよい。
【0057】
スコア値算出時期情報は、スコア値を算出する将来の時を特定する情報である。スコア値は、スコア値算出時期情報が特定する将来の時において、1以上の分類コードが付与された科学文献情報の創出内容を分類コードで表現した場合の確からしさを示す値である。スコア値は、例えば、スコア値算出時期情報が特定する将来の時において、1以上の分類コードが付与された科学文献情報が創出される確率である場合もあるが、確率情報に限らない。
【0058】
ここで、受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。
【0059】
各種の指示や情報等の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。受付部2は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0060】
処理部3は、各種の処理を行う。各種の処理とは、例えば、学習部30、分類コード予測部31、検索部32、時間間隔情報取得部33、創出時予測部34等が行う処理である。
【0061】
学習部30は、学習処理を行い、学習器を取得し、当該学習器を学習器格納部12に蓄積する。
【0062】
学習部30は、例えば、1または2以上の分類コードに対応付く2以上の文書情報を用いて、機械学習のアルゴリズムにより、学習器を構成する。この学習器は、科学文献情報に基づく情報を入力として与えた場合に、少なくとも1以上の分類コードを出力する付与処理に使用される情報である。なお、文書情報は特許文書であり、分類コードはIPC分類コードであることは好適である。また、文書情報が学術論文であり、分類コードはJST分類コードであることも好適である。
【0063】
また、ここでの機械学習は、例えば、深層学習、SVM、決定木、ランダムフォレスト等が利用可能である。ただし、機械学習の種類は問わない。
【0064】
学習部30は、2以上の各文書情報の一部または全部と、各文書情報に対応付く1以上の分類コードとの組を、2組以上、機械学習の関数(例えば、fastText、tensorflowのライブラリ、TinySVM)に与え、当該関数を動作させ、学習処理を行うことにより、学習器を構成し、当該学習器を学習器格納部12に蓄積する。なお、学習処理は公知技術であるので、詳細な説明を省略する。
【0065】
分類コード付与部31は、文献集合格納部11の3以上の各科学文献情報に対して、学習器格納部12の学習器を用いて、機械学習のアルゴリズムにより付与処理を行い、一の種類の1以上の分類コードを付与し、3以上の各科学文献情報に対応付ける。なお、付与処理は予測処理と言っても良い。分類コードの付与は、分類コードを取得することである、と考えても良い。
【0066】
分類コード付与部31は、文献集合格納部11の3以上の各科学文献情報に対して、学習器格納部12の学習器を用いて、機械学習のアルゴリズムにより付与処理を行い、各科学文献情報に対して1以上のIPCを付与し、当該1以上のIPCを各科学文献情報に対応付けて蓄積することは好適である。
【0067】
なお、付与処理で使用する機械学習のアルゴリズムは問わない。機械学習のアルゴリズムは、例えば、深層学習、SVM。決定木、ランダムフォレスト等が利用可能である。
【0068】
機械学習のアルゴリズムにより付与処理を行うことは、例えば、3以上の各科学文献情報と学習器とを機械学習の関数(例えば、fastText、TinySVM、tensorflowのライブラリ)に与え、当該関数を動作させることにより、各科学文献情報に対して一の種類の1以上の分類コードを取得することである。なお、分類コード予測部31は、機械学習の関数を用いて、2以上の分類コードと、各分類コードに対応するスコア値とを取得した場合は、例えば、スコア値が予め決められた条件を満たすほど高い1以上の分類コードを選択して、取得しても良い。予め決められた条件を満たすほどスコアが値高いことは、例えば、スコア値が最大値であること、スコアが閾値以上または閾値より大きいこと等である。
【0069】
検索部32は、例えば、検索情報に合致する分類コードに対応する3以上の科学文献情報を取得する。
【0070】
時間間隔情報取得部33は、文献集合に含まれる3以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する2以上の時間間隔情報を取得する。時間間隔情報は、日数を示す情報でも良いし、月数を示す情報でも良いし、時間数を示す情報でも良い。
【0071】
時間間隔情報取得部33は、着目する3以上の各科学文献情報に対応する創出時情報を文献集合格納部11から取得する。そして、時間間隔情報取得部33は、例えば、取得した3以上の創出時情報をソートする。次に、時間間隔情報取得部33は、例えば、ソートされた3以上の創出時情報において、隣接する2つの創出時情報の差を算出し、当該差である時間間隔情報を取得する。
【0072】
または、時間間隔情報取得部33は、創出時情報によりソートされている3以上の各科学文献情報から創出時情報を順に取得し、当該取得した3以上の創出時情報において、隣接する2つの創出時情報の差を算出し、当該差である時間間隔情報を取得する。
【0073】
創出時予測部34は、時間間隔情報取得部33が取得した2以上の時間間隔情報を用いて、将来創出時情報を取得する。
【0074】
将来創出時情報とは、文献集合の分野における将来の創出時に関する情報である。文献集合の分野とは、技術または科学の分野である。なお、創出時は公開時等と考えても良い。また、文献集合の分野は、例えば、分類コードにより特定される分野である。文献集合の分野は、例えば、検索情報により特定される分野である。将来創出時情報は、例えば、創作時を特定する創出時特定情報(例えば、創作日、創作月)である。また、将来創出時情報は、例えば、創出時特定情報とスコア値との組である創出時スコア情報である。スコア値は、創作内容を分類コードで表現した場合の確からしさを示す情報である。スコア値は、例えば、創出時特定情報が特定する時に創作される内容の分類コードの正しさの確率を示す確率情報である場合もあるが、確率情報に限らない。
【0075】
創出時予測部34は、例えば、時間間隔情報取得部33が取得した2以上の各時間間隔情報の平均値である平均時間間隔情報を取得し、最後の創出時情報が特定する時(例えば、最後の創作日)に平均時間間隔情報が示す時間(例えば、日数)を加算した時である将来創出時情報を取得する。
【0076】
また、創出時予測部34は、例えば、時間間隔情報取得部33が取得した2以上の各時間間隔情報の加重平均である加重平均時間間隔情報を取得し、最後の創出時情報が特定する時(例えば、最後の創作日)に平均時間間隔情報が示す時間(例えば、日数)を加算した時である将来創出時情報を取得する。なお、創出時予測部34は、加重平均を算出する場合に、新しい時期の時間間隔情報の重みを古い時期の時間間隔情報の重みより大きくすることは好適である。
【0077】
また、創出時予測部34は、例えば、分類コード付与部31が科学文献情報に対して付与処理を行った場合に取得したスコア値と、当該科学文献情報に対応する創出時情報とを用いて、将来創出される科学文献のスコア値を取得しても良い。創出時予測部34は、例えば、分類コード付与部31が2以上の各科学文献情報に対して付与処理を行った際に付与した分類コードに対応するスコア値を取得する。
【0078】
具体的には、創出時予測部34は、例えば、分類コード付与部31が2以上の各科学文献情報に対して付与処理を行った際に取得したスコア値と2以上の各科学文献情報に対応する創出時情報との組を2組以上取得し、当該2組以上の情報を用いて、スコア値算出時期情報が特定する時のスコア値を予測し、予測値であるスコア値を取得する。なお、かかる処理は、例えば、公知の外挿の処理により実現され得る。また、外挿に用いる関数は問わない。 なお、スコア値算出時期情報は、スコア値を算出する将来の時を特定する情報である。スコア値は、スコア値算出時期情報が特定する将来の時において、1以上の分類コードが付与された科学文献情報の創出内容を分類コードで表現した場合の確からしさを示す値である。スコア値は、例えば、スコア値算出時期情報が特定する将来の時において、1以上の分類コードが付与された科学文献情報が創出される確率である場合もあるが,確率情報に限らない。
【0079】
また、創出時予測部34は、例えば、後述する間隔代表値情報取得手段341、後述するばらつき情報取得手段342、後述する判断手段343、後述する将来創出時情報取得手段344により、2以上の時間間隔情報を用いて、将来創出時情報を取得する。
【0080】
間隔代表値情報取得手段341は、2以上の各時間間隔情報の代表値である間隔代表値情報を取得する。間隔代表値情報とは、例えば、2以上の時間間隔情報の平均値である。また、間隔代表値情報とは、例えば、2以上の時間間隔情報の加重平均である。なお、間隔代表値情報取得手段341は、加重平均を算出する場合に、新しい時期の時間間隔情報の重みを古い時期の時間間隔情報の重みより大きくすることは好適である。また、間隔代表値情報取得手段341は、通常、時間間隔情報取得部33が取得した2以上の時間間隔情報の代表値である間隔代表値情報を取得する。
【0081】
間隔代表値情報取得手段341は、例えば、一の種類の分類コードごとに、時間間隔情報取得部33が取得した2以上の時間間隔情報の代表値である間隔代表値情報を取得する。ここでの分類コードは、1つでも良いし、2以上でも良い。
【0082】
間隔代表値情報取得手段341は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードおよび筆頭以外分類コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報の代表値である間隔代表値情報を取得する。なお、かかる2以上の時間間隔情報は、通常、時間間隔情報取得部33が取得した情報である。
【0083】
間隔代表値情報取得手段341は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭のIPCと筆頭以外のIPCとに対応付けられている3以上の科学文献情報に対応付く創出時情報から取得された2以上の時間間隔情報の代表値である間隔代表値情報を取得することは好適である。
【0084】
間隔代表値情報取得手段341は、例えば、一の種類の2または3以上の分類コードごとに、2以上の時間間隔情報の代表値である間隔代表値情報を取得する。一の種類の2以上の分類コードとは、一の種類の筆頭分類コードおよび筆頭以外分類コードである。
【0085】
間隔代表値情報取得手段341は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の2または3以上の分類コードごとに、2以上の時間間隔情報の代表値である間隔代表値情報を取得する。一の種類の2以上の分類コードとは、一の種類の筆頭分類コードおよび筆頭以外分類コードである。
【0086】
間隔代表値情報取得手段341は、例えば、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報の代表値である間隔代表値情報を取得する。なお、分類コードがIPCの「G06F17/30」である場合、上位コードは、例えば、「G06F17/00」「G06F17/」「G06F」「G06」「G」である。
【0087】
間隔代表値情報取得手段341は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報の代表値である間隔代表値情報を取得する。
【0088】
間隔代表値情報取得手段341は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードごとに、2以上の時間間隔情報の代表値である間隔代表値情報を取得する。
【0089】
ばらつき情報取得手段342は、時間間隔情報取得部33が取得した2以上の時間間隔情報のばらつきに関するばらつき情報を取得する。ばらつき情報は、例えば、2以上の時間間隔情報から取得されたBPT分布モデルにおける変動係数(α)である。また、ばらつき情報は、例えば、2以上の時間間隔情報から取得された分散、または標準偏差である。なお、変動係数、分散、標準偏差を算出する方法は、公知技術であるので詳細な説明は省略する。
【0090】
ばらつき情報取得手段342は、例えば、一の種類の分類コードごとに、2以上の時間間隔情報のばらつきに関するばらつき情報を取得する。ここでの分類コードは、1つでも良いし、2以上でも良い。
【0091】
ばらつき情報取得手段342は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードおよび筆頭以外分類コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報に対するばらつき情報を取得する。なお、かかる2以上の時間間隔情報は、通常、時間間隔情報取得部33が取得した情報である。
【0092】
ばらつき情報取得手段342は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭のIPCと筆頭以外のIPCとに対応付けられている3以上の科学文献情報に対応付く創出時情報から取得された2以上の時間間隔情報に対するばらつき情報を取得する。
【0093】
ばらつき情報取得手段342は、例えば、一の種類の2または3以上の分類コードごとに、2以上の時間間隔情報に対するばらつき情報を取得する。
【0094】
ばらつき情報取得手段342は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の2または3以上の分類コードごとに、2以上の時間間隔情報に対するばらつき情報を取得する。
【0095】
ばらつき情報取得手段342は、例えば、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報に対するばらつき情報を取得する。
【0096】
ばらつき情報取得手段342は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する3以上の科学文献情報に対応付けられた3以上の創出時情報を用いて取得された2以上の時間間隔情報に対するばらつき情報を取得する。
【0097】
ばらつき情報取得手段342は、例えば、後述する判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードごとに、2以上の時間間隔情報に対するばらつき情報を取得する。
【0098】
判断手段343は、ばらつき情報取得手段342が取得したばらつき情報が特定するばらつきが、予め決められた条件を満たすほど、大きいか小さいかを判断する。予め決められた条件は、例えば、値であるばらつき情報が閾値以上であること、値であるばらつき情報が閾値より大きいこと等である。予め決められた条件は、例えば、変動係数(α)が0.5以上であること、または変動係数(α)が0.5より大きいことである。
【0099】
判断手段343は、終了条件に合致するか否かを判断する。上述したように、終了条件は、例えば、着目している分類コードに関する条件である。終了条件は、例えば、着目している分類コードの階層に関する条件である。終了条件は、例えば、着目している分類コードの階層が最上位の階層であることである。つまり、判断手段343は、例えば、着目している分類コードの階層が最上位の階層であることを判断する。また、判断手段343は、例えば、着目している分類コードの階層が最上位の階層であり、取得されたばらつき情報が閾値以上または閾値より大きい、と判断する。
【0100】
将来創出時情報取得手段344は、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する。
【0101】
将来創出時情報取得手段344は、例えば、一の種類の分類コードごとに、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得する。
【0102】
将来創出時情報取得手段344は、通常、間隔代表値情報が先の時期を示す情報であればあるほど、先の時期を示す将来創出時情報を取得する。
【0103】
将来創出時情報取得手段344は、例えば、ばらつき情報が特定するばらつきが予めきめられた条件を満たすほど大きい場合に、将来創出時情報を取得しない、またはエラーメッセージを取得する。
【0104】
将来創出時情報取得手段344は、間隔代表値情報とばらつき情報とをBPT分布モデル又は対数正規分布モデルに適用し、将来創出時情報を取得することは好適である。なお、BPT分布モデル、対数正規分布モデル、各モデルを用いた情報の取得については公知技術であるので、詳細な説明を省略する。
【0105】
将来創出時情報取得手段344は、例えば、間隔代表値情報とばらつき情報とをBPT分布モデル又は対数正規分布モデルに適用し、創出時特定情報とスコア値との組である創出時スコア情報を、1組または2組以上、取得する。 将来創出時情報取得手段344は、一の種類の分類コードごとに、間隔代表値情報とばらつき情報とをBPT分布モデル又は対数正規分布モデルに適用し、将来創出時情報を取得することは好適である。
【0106】
将来創出時情報取得手段344は、例えば、間隔代表値情報をパラメータとする増加関数により将来創出時情報を取得する。
【0107】
将来創出時情報取得手段344は、例えば、判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭分類コードおよび筆頭以外分類コードに対応する間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。
【0108】
将来創出時情報取得手段344は、例えば、判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードおよび筆頭以外分類コードごとに、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。
【0109】
将来創出時情報取得手段344は、例えば、判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードに対応する間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。
【0110】
将来創出時情報取得手段344は、例えば、判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、一の種類の筆頭分類コードに含まれる上位コードおよび筆頭以外分類コードに含まれる上位コードごとに、間隔代表値情報とばらつき情報とを用いて、将来創出時情報を取得することは好適である。
【0111】
出力部4は、創出時予測部34が取得した将来創出時情報を出力する。なお、出力部4が出力する将来創出時情報の構造等は問わない。将来創出時情報が2以上の創出時スコア情報である場合、出力部4は、例えば、創出時スコア情報が有する創出時特定情報を横軸、創出時スコア情報が有するスコア値を縦軸とするグラフである将来創出時情報を出力しても良い。また、将来創出時情報が創出時特定情報である場合、出力部4は、単に当該創出時特定情報を出力しても良い。
【0112】
出力部4は、判断手段343が、予め決められた条件を満たすほどばらつきが小さいと判断した場合に、将来創出時情報を出力することは好適である。
【0113】
出力部4は、例えば、判断手段343が、予め決められた条件を満たすほどばらつきが大きいと判断した場合、エラーメッセージを出力することは好適である。また、出力部4は、例えば、判断手段343が終了条件に合致すると判断した場合、エラーメッセージを出力することは好適である。
【0114】
ここで、出力とは、ディスプレイへの表示であるが、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である、と考えても良い。
【0115】
格納部1、文献集合格納部11、および学習器格納部12は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0116】
格納部1等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部1等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部1等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部1等で記憶されるようになってもよい。
【0117】
処理部3、学習部30、分類コード予測部31、検索部32、時間間隔情報取得部33、および創出時予測部34は、通常、MPU、CPU、GPUやメモリ等から実現され得る。処理部3等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0118】
出力部4は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部4は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0119】
次に、予測装置Aが将来創出時情報を取得する処理の例について、図2のフローチャートを用いて説明する。
【0120】
(ステップS201)受付部2は、開始指示を受け付けたか否かを判断する。開始指示を受け付けた場合はステップS202に行き、開始指示を受け付けなかった場合はステップS201に戻る。
【0121】
(ステップS202)処理部3は、ステップS201で受け付けられた開始指示が検索情報を含むか否かを判断する。検索情報を含む場合はステップS203に行き、検索情報を含まない場合はステップS204に行く。
【0122】
(ステップS203)検索部32は、ステップS201で受け付けられた開始指示に含まれる検索情報を用いて、文献集合格納部11から3以上の科学文献情報を検索する。なお、ここで、検索部32は、処理対象の科学文献情報を決定すれば良い。つまり、検索部32は、科学文献情報を取得しても良いが、取得する必要はなく、科学文献情報のIDまたは科学文献情報に対応付く創出時情報等を取得しても良い。
【0123】
(ステップS204)検索部32は、文献集合格納部11に格納されている3以上の科学文献情報を、処理対象の科学文献情報として決定する。つまり、検索部32は、3以上の科学文献情報、または3以上の科学文献情報のIDまたは3以上の科学文献情報に対応付く創出時情報等を文献集合格納部11から取得する。
【0124】
(ステップS205)時間間隔情報取得部33は、ステップS203またはステップS204で決定された3以上の科学文献情報または科学文献情報に対応する情報を用いて、2以上の時間間隔情報を取得する。かかる時間間隔情報取得処理の例について、図3のフローチャートを用いて説明する。
【0125】
(ステップS206)創出時予測部34は、ステップS205で取得された2以上の時間間隔情報を用いて、創出時予測処理を行い、将来創出時情報を取得する。創出時予測処理の例について、図4のフローチャートを用いて説明する。
【0126】
(ステップS207)処理部3は、ステップS206で将来創出時情報を取得できたか否かを判断する。将来創出時情報を取得できた場合はステップS208に行き、将来創出時情報を取得できなかった場合はステップS209に行く。
【0127】
(ステップS208)創出時予測部34は、ステップS206で取得された将来創出時情報を出力する。ステップS201に戻る。
【0128】
(ステップS209)創出時予測部34は、格納部1からエラーメッセージを取得し、当該エラーメッセージを出力する。ステップS201に戻る。
【0129】
なお、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0130】
次に、ステップS205の時間間隔情報取得処理の例について、図3のフローチャートを用いて説明する。
【0131】
(ステップS301)時間間隔情報取得部33は、処理対象のすべての科学文献情報に対応付いている創出時情報を文献集合格納部11から取得する。なお、処理対象の科学文献情報に対応付く共通の分類コードは、例えば、最下位の分類コード(例えば、「G06F17/30」)である。
【0132】
(ステップS302)時間間隔情報取得部33は、ステップS301で取得した創出時情報をソートする。なお、ソートは、時の古い順に行っても、時の新しい古い順に行っても良い。つまり、ソートは、昇順でも降順でも良い。
【0133】
(ステップS303)時間間隔情報取得部33は、カウンタiに2を代入する。
【0134】
(ステップS304)時間間隔情報取得部33は、ステップS302でソートした結果の創出時情報の集合の中で、i番目の創出時情報が存在するか否かを判断する。i番目の創出時情報が存在する場合はステップS305に行き、存在しない場合は上位処理にリターンする。
【0135】
(ステップS305)時間間隔情報取得部33は、i番目の創出時情報と(i-1)番目の創出時情報との差「創出時情報(i)-創出時情報(i-1)」である時間間隔情報を取得し、図示しないバッファに一時蓄積する。
【0136】
(ステップS306)時間間隔情報取得部33は、カウンタiを1、インクリメントする。ステップS304に戻る。
【0137】
次に、ステップS206の創出時予測処理の例について、図4のフローチャートを用いて説明する。
【0138】
(ステップS401)間隔代表値情報取得手段341は、図示しないバッファに存在するすべての時間間隔情報であり、2以上の時間間隔情報を取得し、当該2以上の時間間隔情報の代表値である間隔代表値情報(μ)を取得する。なお、間隔代表値情報(μ)は、例えば、2以上の時間間隔情報の平均値である。
【0139】
(ステップS402)ばらつき情報取得手段342は、図示しないバッファに存在する2以上の時間間隔情報を取得し、当該2以上の時間間隔情報を用いて、ばらつき情報(α)を取得する。なお、ばらつき情報(α)は、例えば、2以上の時間間隔情報の変動係数であり、具体的には、時間間隔情報のばらつきの標準偏差(σ)を、間隔代表値情報(μ)で除したものである。即ち、例えば、α=σ/μである。
【0140】
(ステップS403)判断手段343は、ステップS402で取得されたばらつき情報(α)が予め決められた条件を満たすほど、ばらつきが少ないことを示す情報であるか否かを判断する。条件を満たす場合はステップS404に行き、条件を満たさない場合はステップS405に行く。なお、予め決められた条件は、例えば、「変動係数<0.5」または「変動係数<=0.5」である。
【0141】
(ステップS404)将来創出時情報取得手段344は、間隔代表値情報(μ)とばらつき情報(α)とを用いて、将来創出時情報を取得する。上位処理にリターンする。
【0142】
(ステップS405)判断手段343は、終了条件に合致するか否かを判断する。終了条件に合致しない場合はステップS406に行き、終了条件に合致する場合は上位処理にリターンする。なお、終了条件は、格納部1に格納されている。終了条件は、例えば、着目する分類コードが最上位の分類コードであることである。
【0143】
(ステップS406)検索部32は、使用する分類コードを変更する。分類コードの変更は、例えば、今まで着目していた筆頭分類コードに加えて、筆頭以外分類コードも含む2以上の分類コードに、着目する分類コードを変更し、かつ今まで着目していた筆頭分類コード(例えば、「G06F17/30」)の階層を、一段、上位の階層の分類コード(例えば、「G06F17」「G06F17/00」)に変更することである。
【0144】
(ステップS407)検索部32は、ステップS406で変更した分類コードに対応する3以上の科学文献情報を文献集合格納部11から検索する。
【0145】
(ステップS408)時間間隔情報取得部33は、ステップS407で検索された3以上の科学文献情報に対応する3以上の創出時情報を用いて、時間間隔情報を取得する。かかる時間間隔情報取得処理は、図3のフローチャートを用いて説明した。
【0146】
(ステップS409)創出時予測部34は、創出時予測処理を行う。創出時予測処理は、図4のフローチャートにおける処理である。
【0147】
次に、予測装置Aが学習器を構築する処理の例について、図5のフローチャートを用いて説明する。なお、ここでの学習処理は、特許情報を使用した学習処理の例である。
【0148】
(ステップS501)学習部30は、カウンタiに1を代入する。
【0149】
(ステップS502)学習部30は、学習対象の特許情報の中で、i番目の特許情報が存在するか否かを判断する。i番目の特許情報が存在する場合はステップS503に行き、i番目の特許情報が存在しない場合はステップS507に行く。
【0150】
(ステップS503)学習部30は、i番目の特許情報に対応付いている1以上の特許分類コードを取得する。なお、ここでの特許分類コードは、科学文献情報に対応付けたい特許分類コードであり、例えば、IPCである。また、ここで、取得される特許分類コードは、例えば、特許情報に対応付いているすべての特許分類コードであるが、筆頭分類コードのみでも良い。
【0151】
(ステップS504)学習部30は、i番目の特許情報の一部または全部を格納部1から取得する。なお、ここで取得する情報は、学習対象の情報である。
【0152】
(ステップS505)学習部30は、ステップS504で取得したi番目の特許情報の一部または全部と、ステップS503で取得した1以上の特許分類コードとを対応付けて、図示しないバッファに一時蓄積する。
【0153】
(ステップS506)学習部30は、カウンタiを1、インクリメントする。ステップS502に戻る。
【0154】
(ステップS507)学習部30は、図示しないバッファに一時蓄積されている、特許情報の一部または全部と1以上の特許分類コードとの組を、2組以上用いて、学習処理を行い、学習器を取得する。
【0155】
(ステップS508)学習部30は、ステップS507で取得した学習器を学習器格納部12に蓄積する。処理を終了する。
【0156】
次に、予測装置Aが分類コードを科学文献情報に対応付ける処理の例について、図6のフローチャートを用いて説明する。
【0157】
(ステップS601)分類コード予測部31は、学習器格納部12から学習器を取得する。
【0158】
(ステップS602)分類コード予測部31は、カウンタiに1を代入する。
【0159】
(ステップS603)分類コード予測部31は、分類コードを対応付ける対象のi番目の科学文献情報が存在するか否かを判断する。i番目の科学文献情報が存在する場合はステップS604に行き、i番目の科学文献情報が存在しない場合は上位処理にリターンする。
【0160】
(ステップS604)分類コード予測部31は、i番目の科学文献情報の中の情報であり、予測処理で使用する一部または全部の情報を文献集合格納部11から取得する。
【0161】
(ステップS605)分類コード予測部31は、ステップS604で取得したi番目の科学文献情報の一部または全部の情報を、ステップS601で取得した学習器に適用し、付与処理を行い、1以上の特許分類コードを取得する。
【0162】
なお、ここで、分類コード予測部31は、1以上の各特許分類コードとスコア値とを取得することは好適である。そして、スコア値が条件を満たすほど高い(例えば、閾値以上または閾値より大きい)場合に、当該スコア値と対になる特許分類コードを取得することは好適である。また、分類コード予測部31は、スコア値の高い順にソートすることは好適である。また、スコア値が最も高い分類コードは、筆頭分類コードである。
【0163】
(ステップS606)分類コード予測部31は、ステップS605で取得した1以上の特許分類コードをi番目の科学文献情報に対応付ける。
【0164】
(ステップS607)分類コード予測部31は、カウンタiを1、インクリメントする。ステップS603に戻る。
【0165】
以下、本実施の形態における予測装置Aにおける4つの実験例について説明する。
【0166】
実験1、実験2において、まず、過去20年程度の論文である科学文献情報(645編)を準備し、予測装置Aの格納部1に蓄積した。また、科学文献情報には、JST分類コードと論文の発表日(創出時情報)が対応付いている。なお、科学文献情報(645編)は、K大学のK教授を中心とするバイオ研究グループの論文である。また、科学文献情報(645編)は、“Journal of Bioscience and Bioengineering”、”Bioresource Technology“等の科学ジャーナルに掲載された学術論文、日本生物工学会の発表予稿集等である。
【0167】
なお、各科学文献情報に対して、機械学習(Deep Learning等)を用いて、IPCを対応付けた。なお、かかる処理には、予測装置Aにおける学習部30と分類コード付与部31とを用いた。以上により、各科学文献情報には、元より付与されていたJST分類コードと分類コード付与部により付与されたIPC分類コードとが対応付いた。
【0168】
そして、実験1、実験2において、間隔代表値情報は、論文の発表期間の平均値(μ)を用いた。つまり、間隔代表値情報取得手段341が、論文の発表期間の平均値(μ)を取得する。また、ばらつき情報は、論文の発表期間の変動件数(α)を用いた。つまり、ばらつき情報取得手段342は変動件数(α=σ/μ、ここでσは時間間隔情報のばらつきの標準偏差)を取得する。そして、上記の予め決められた条件として、「変動件数(α)<0.5」を用いた。また、将来創出時情報の取得のためのモデルとして、BPT分布モデルを用いた。その理由は、BPT分布モデルが適用されている地震発生予測と論文発表予測とに、以下に述べるアナロジーが存在するからである。即ち、地震発生には「ユーラシアプレートはフィリピン海プレートから常にプレッシャーを受け続け、一定の限界に達すると地震が発生することで一時的にプレッシャーから解放される」というサイクルが存在する。一方、論文発表にも「研究者は常に発表をしなければならないというプレッシャーを受け続け、一定の成果が蓄積すれば、それを論文として発表することで、一時的にプレッシャーから解放される」というサイクルが存在するからある。そしてBPT分布モデルは、一定のプレッシャーを受けつつ、行きつ戻りつする過程(例えば一定流速下でのブラウン運動)を記述できる理論であるからである。加えて、対数正規分布モデルも地震発生予測に用いられていることから、BPT分布モデルと同様に論文発表予測に適用しうると考えられる。
(実験1)
【0169】
以上の前提の元、“Journal of Bioscience and Bioengineering”に掲載された「JST分類コード=FK03030L*IPC分類コード=C12P7」の検索情報に対応する科学文献情報に対して、予測装置Aを動作させた。なお、ここで、使用する分類コードは、各科学文献情報に対応付く1以上の分類コードの中で、筆頭の分類コードのみである、とする。また、使用する分類コードは、最下位までの分類コード(JST分類コード=FK03030L:微生物代謝産物,IPC分類コード=C12P7:酸素原子含有有機化合物)である、とする。
【0170】
すると、予測装置Aは、論文の発表期間の平均値「μ=2.11年」、変動係数「α=0.295」を得た。そして、予測装置Aの判断手段343は、変動係数「α=0.295」は条件「変動件数(α)<0.5」を満たす、と判断する。
【0171】
そして、予測装置Aの将来創出時情報取得手段344は、間隔代表値情報「μ=2.11年」とばらつき情報「α=0.295」とをBPTモデルに適用し、将来創出時情報を取得した。かかる将来創出時情報は、最後の論文発表日からの日数と確率の組の集合である。また、将来創出時情報取得手段344は、ここでは、今後1年間の論文発表確率をY軸とし、現時点からの経過年数t(t<=1年)をX軸とするグラフを構成した。なお計算式は、「長期的な地震発生確率の評価手法について」(平成13年6月 地震調査研究推進本部 地震調査委員会)に詳細な説明がされている。さらに 最近、BPT分布モデル、対数正規分布モデルを含む各種の確率分布モデルの解説が、「地震発生の長期予測モデルについて」(2019年1月12日:東北大学耐震工学研究会・柴田明徳東北大学名誉教授)によって公開されている。本発明における確率計算は、主に後者の文献に記載された方法によって行われている。
【0172】
そして、出力部4は、将来創出時情報取得手段344が構成したグラフを出力する。ここでのグラフは、図7である。
【0173】
図7において、701は論文最終発表から現時点までの経過年数が0.1年の場合の今後1年間の論文発表確率、702は0.2年の場合、703は0.3年の場合、704は0.4年の場合、705は0.5年の場合、706は0.6年の場合、707は4.0年の場合である。図7から、論文最終発表から現時点までの経過年数が0.2年の場合、今後1年間に当該分野における次の論文が発表される確率は0%から73%に増加と予測されることが分かる。また論文最終発表から現時点までの経過年数が4.0年の場合、今後1年間に当該分野における次の論文が発表される確率は42%から100%までに増加と予測されることが分かる。
(実験2)
【0174】
実験1と掲載ジャーナルが”Bioresource Technology“であることを除いて、同じJST分類コード、IPC分類コードの前提の元、予測装置Aを動作させた。なお、ここで、使用する分類コードは、各科学文献情報に対応付く1以上の分類コードの中で、まずは、筆頭分類コードだけである。
【0175】
そして、予測装置Aを動作させた。すると、時間間隔情報取得部33の時間間隔情報取得部33は、筆頭分類コード「C12P7」に対して、論文の発表期間を取得した。
【0176】
次に、予測装置Aの間隔代表値情報取得手段341は、論文の発表期間の平均値「μ=219日」を取得した。また、ばらつき情報取得手段342は、変動係数「α=0.812」を取得した。かかる図は、図8である。図8において、論文発表間隔が強く揺動しているため、αの値が大きくなる。また、図8において、横軸は論文発表時(年)、縦軸はIPC「C12P7」である。
【0177】
次に、予測装置Aの判断手段343は、変動係数「α=0.812」は条件「変動件数(α)<0.5」を満たさない、と判断する。
【0178】
次に、予測装置Aは、分類の階層構造を用いて、上位階層に移行して、論文発表間隔を取得する。つまり、予測装置Aは、使用する分類コードを上位階層の分類コードに変更する。例えば、予測装置Aは、「C12P7」を「C12P」に変更する。そして、時間間隔情報取得部33は、上位階層の各分類コードごとに、論文の発表期間を取得した。
【0179】
また、ここで、予測装置Aの処理部3は、1または2の発表しかない分類コードは、時間間隔が2以上取得できないため、ばらつきの計算ができず、除外することとした。なお、ここで、処理部3は、予め決められた条件を満たすほど少ない発表しかない分類コードを、処理対象から除外する、とする。つまり、予測装置Aは、1または2の発表しかない分類コードである「B09B」「C08B」等を除外する。
【0180】
次に、時間間隔情報取得部33は、除外された分類コードの除く、他のすべての各分類コードに対して、論文の発表期間を取得した。かかる図は、図9である。図9において、除外されなかった分類コードであり、上位階層の分類コードは、「C12N」「C12P」「C12R」である。
【0181】
そして、予測装置Aの間隔代表値情報取得手段341は、「C12N」について論文の発表期間の平均値「μ=751日」を取得した。また、ばらつき情報取得手段342は、変動係数「α=0.399」を得た。また「C12R」について論文の発表期間の平均値「μ=792日」を取得した。また、ばらつき情報取得手段342は、変動係数「α=0.539」を得た。
【0182】
次に、予測装置Aの判断手段343は、「C12N」について変動係数「α=0.399」は条件「変動件数(α)<0.5」を満たす、と判断する。また、「C12R」について変動係数「α=0.539」は「変動件数(α)<0.5」を満たさない、と判断する。
【0183】
そして、予測装置Aの将来創出時情報取得手段344は、「C12N」について間隔代表値情報「μ=751日」とばらつき情報「α=0.399」とをBPTモデルに適用し、将来創出時情報を取得した。かかる将来創出時情報は、最後の論文発表日からの日数と確率の組の集合である。また、将来創出時情報取得手段344は、ここでは、今後1年間の論文発表確率をY軸とし、現時点からの経過年数t(t<=1年)をX軸とするグラフを構成した。
【0184】
そして、出力部4は、将来創出時情報取得手段344が構成したグラフを出力する。ここでのグラフは、図10である。
【0185】
図10において、1001は論文最終発表から現時点までの経過年数が0.1年の場合の今後1年間の論文発表確率、1002は0.2年の場合、1003は0.3年の場合、1004は0.4年の場合、1005は0.5年の場合、1006は0.6年の場合、1007は0.7年の場合、1008は0.8年の場合、1009は4.0年の場合である。図10から、論文最終発表から現時点までの経過年数が0.8年の場合、今後1年間に当該分野における次の論文が発表される確率は15%から91%に増加と予測されることが分かる。
(実験3)
【0186】
実験3において、実験1における科学文献情報(ここでは論文)が6つ格納部1に格納されている、とする。そして、分類コード付与部31により、6つの各論文において、分類コードとスコア値とが対応付けられた、とする。なお、対応付けられた分類コードは、「C12P」「C12N」の2つである、とする。また、6つの科学文献情報に対応付いている創出時情報は、「2009/12」「2012/6」「2014/2」「2015/3」「2017/1」「2019/2」である、とする。
【0187】
かかる場合、受付部2は、スコア値算出時期情報「現在から1年後」を受け付けた、とする。すると、創出時予測部34は、まず、分類コード「C12P」について、6つの各論文の創出時情報と、分類コード「C12P」および論文に対応付くスコア値との組(以下、適宜、「組情報」と言う)を取得する。かかる6つの組情報は、図11の「ID=1」のレコードの属性値「組情報」の値である。組情報は、(創出時情報,スコア値)の構造である。そして、創出時予測部34は、受付部2が受け付けたスコア値算出時期情報「現在から1年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「1.2年後」を取得する。次に、創出時予測部34は、図11の「ID=1」の6つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「1.2年後」のスコア値「0.83」を算出する。なお、かかるスコア値「0.83」は、将来創出時情報の例である。
【0188】
次に、創出時予測部34は、分類コード「C12N」について、6つの各論文の創出時情報と、分類コード「C12N」および論文に対応付くスコア値との組である組情報を取得する。かかる6つの組情報は、図11の「ID=2」のレコードの属性値「組情報」の値である。そして、創出時予測部34は、受付部2が受け付けたスコア値算出時期情報「現在から1年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「1.2年後」を取得する。次に、創出時予測部34は、図11の「ID=2」の6つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「1.2年後」のスコア値「0.03」を算出する。なお、かかるスコア値「0.03」は、将来創出時情報の例である。 次に、出力部4は、創出時予測部34が取得した将来創出時情報であるスコア値を出力する。ここで、出力部4は、例えば、分類コードごとに、図12に示すようなグラフを出力する。図12の1201は、分類コード「C12P」のスコア値の推移と、現在から1年後の予測されたスコア値とを示すグラフである。また、1202は、分類コード「C12N」のスコア値の推移と、現在から1年後の予測されたスコア値とを示すグラフである。
(実験4)
【0189】
実験4において、実験2における科学文献情報(ここでは論文)が4つ格納部1に格納されている、とする。そして、分類コード付与部31により、4つの各論文において、分類コードとスコア値とが対応付けられた、とする。なお、対応付けられた分類コードは、「C12P7」「C12N1」の2つのである、とする。また、4つの科学文献情報に対応付いている創出時情報は、「2011/11」「2014/1」「2017/1」「2018/1」である、とする。
【0190】
かかる場合、受付部2は、スコア値算出時期情報「現在から1年後」を受け付けた、とする。すると、創出時予測部34は、まず、分類コード「C12P7」について、4つの各論文の創出時情報と、分類コード「C12P7」および論文に対応付くスコア値との組である組情報を取得する。かかる4つの組情報は、図11の「ID=3」のレコードの属性値「組情報」の値である。そして、創出時予測部34は、受付部2が受け付けたスコア値算出時期情報「現在から1年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「1.8年後」を取得する。次に、創出時予測部34は、図11の「ID=3」の4つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「1.8年後」のスコア値「0.80」を算出する。なお、かかるスコア値「0.80」は、将来創出時情報の例である。そして、創出時予測部34は、受付部2が受け付けたスコア値算出時期情報「現在から1年後」と図示しない時計から取得した現在日付とを用いて、最後の論文の創出時情報が特定する時から値「1.8年後」を取得する。次に、創出時予測部34は、分類コード「C12N1」について、4つの各論文の創出時情報と、分類コード「C12N1」および論文に対応付くスコア値との組である組情報を取得する。かかる4つの組情報は、図11の「ID=4」のレコードの属性値「組情報」の値である。
次に、創出時予測部34は、図11の「ID=4」の4つの組情報を用いて外挿法により、最後の論文の創出時情報が特定する時から値「1.8年後」のスコア値「0.03」を算出する。なお、かかるスコア値「0.803」は、将来創出時情報の例である。
【0191】
次に、出力部4は、創出時予測部34が取得した将来創出時情報であるスコア値を出力する。ここで、出力部4は、例えば、分類コードごとに、図13に示すようなグラフを出力する。図13の1301は、分類コード「C12P7」のスコア値の推移と、スコア値算出時期情報「3000」の時点の予測されたスコア値とを示すグラフである。また、1302は、分類コード「C12N1」のスコア値の推移と、現在から1年後の時点の予測されたスコア値とを示すグラフである。
【0192】
以上、本実施の形態によれば、技術の将来の創出時に関する情報を取得できる。その結果、例えば、大学や研究機関等において、特許出願や産学連携等を担当する担当者が、適切な時期に研究者にコンタクトし、特許出願や産学連携等の研究支援を行うことできる。つまり、例えば、上記担当者が研究者にコンタクトし、研究支援を行おうとした際に、研究者が既に論文発表をしており、新規性を喪失し特許出願できない、または産学連携が上手く進められない、といったことを防止できる。またオープンイノベーションによる研究開発を行う場合、関係する多くの研究者の研究成果がどの段階で発表されるのかを、事前に予想することができるため、研究マネジメントを円滑に進めることができる。以上より、予測装置Aに係る技術は、産学連携支援技術、研究支援技術と言っても良い。
【0193】
また、本実施の形態によれば、技術の将来の創出時に関するより適切な情報を取得しうる。
【0194】
また、本実施の形態によれば、JST分類コードと機械学習法等によって付与されたIPC分類コードを用いて、将来の論文発表日に関する情報を取得しうる。
【0195】
また、本実施の形態によれば、IPC分類コードと機械学習法等によって付与されたJST分類コードを用いて、特許出願日に関するより適切な情報を取得しうる。
【0196】
なお、本実施の形態における予測装置Aは、学習機能等を有さなくても良い。つまり、予測装置Aは、学習部30、分類コード予測部31を有さなくても良い。かかる場合、予測装置Aの処理部3は、例えば、検索部32、時間間隔情報取得部33、および創出時予測部34を備える。また、予測装置Aの処理部3は、検索部32を有さなくても良い。予測装置Aの処理部3は、例えば、時間間隔情報取得部33、および創出時予測部34を備える。
【0197】
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における予測装置Aを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、1または2種類以上の分類コードと創出時を特定する創出時情報とに対応する3以上の科学文献情報であり、処理対象の科学文献情報の集合である文献集合が格納される文献集合格納部にアクセス可能なコンピュータを、前記文献集合に含まれる3以上の各科学文献情報に対応する創出時情報を用いて、科学文献情報の創出時の時間間隔を特定する2以上の時間間隔情報を取得する時間間隔情報取得部と、前記2以上の時間間隔情報を用いて、前記文献集合の分野における将来の創出時に関する将来創出時情報を取得する創出時予測部と、前記将来創出時情報を出力する出力部として機能させるためのプログラムである。
【0198】
また、図11は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の予測装置Aを実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図11は、このコンピュータシステム300の概観図であり、図12は、システム300のブロック図である。
【0199】
図11において、コンピュータシステム300は、CD-ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。
【0200】
図12において、コンピュータ301は、CD-ROMドライブ3012に加えて、MPU3013と、CD-ROMドライブ3012等に接続されたバス3014と、ブートアッププログラム等のプログラムを記憶するためのROM3015と、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3017とを含む。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
【0201】
コンピュータシステム300に、上述した実施の形態の予測装置Aの機能を実行させるプログラムは、CD-ROM3101に記憶されて、CD-ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD-ROM3101またはネットワークから直接、ロードされても良い。
【0202】
プログラムは、コンピュータ301に、上述した実施の形態の予測装置Aの機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
【0203】
なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
【0204】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0205】
また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。つまり、予測装置Aは、サーバとして機能しても良い。かかる場合、受付部2は、図示しない端末装置から開始指示等を受信する。また、出力部4は、図示しない端末装置に将来創出時情報を送信する。また、予測装置Aがサーバである場合、当該サーバは、いわゆるクラウドサーバ、ASPサーバ等、問わない。
【0206】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0207】
以上のように、本発明にかかる予測装置は、技術の将来の創出時に関する情報を取得できるという効果を有し、予測装置等として有用である。
【符号の説明】
【0208】
A 予測装置
1 格納部
2 受付部
3 処理部
4 出力部
11 文献集合格納部
12 学習器格納部
30 学習部
31 分類コード予測部
32 検索部
33 時間間隔情報取得部
34 創出時予測部
341 間隔代表値情報取得手段
342 情報取得手段
343 判断手段
344 将来創出時情報取得手段
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15