IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 池田 虎三の特許一覧

特許7545605情報処理システム、情報処理方法及びプログラム
<>
  • 特許-情報処理システム、情報処理方法及びプログラム 図1
  • 特許-情報処理システム、情報処理方法及びプログラム 図2
  • 特許-情報処理システム、情報処理方法及びプログラム 図3
  • 特許-情報処理システム、情報処理方法及びプログラム 図4
  • 特許-情報処理システム、情報処理方法及びプログラム 図5
  • 特許-情報処理システム、情報処理方法及びプログラム 図6
  • 特許-情報処理システム、情報処理方法及びプログラム 図7
  • 特許-情報処理システム、情報処理方法及びプログラム 図8
  • 特許-情報処理システム、情報処理方法及びプログラム 図9
  • 特許-情報処理システム、情報処理方法及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-08-27
(45)【発行日】2024-09-04
(54)【発明の名称】情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20240828BHJP
【FI】
G06Q50/10
【請求項の数】 12
(21)【出願番号】P 2024051335
(22)【出願日】2024-03-27
【審査請求日】2024-03-28
【早期審査対象出願】
(73)【特許権者】
【識別番号】523013569
【氏名又は名称】池田 虎三
(74)【代理人】
【識別番号】110002789
【氏名又は名称】弁理士法人IPX
(72)【発明者】
【氏名】池田 虎三
【審査官】塚田 肇
(56)【参考文献】
【文献】韓国登録特許第10-1823463(KR,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
情報処理システムであって、
少なくとも1つのプロセッサを備え、前記少なくとも1つのプロセッサは、次の各ステップがなされるようにプログラムを実行するように構成され、
受付ステップでは、第1の研究者の名前と、前記第1の研究者が所属する所属機関名と受け付け、ここで、前記名前と前記所属機関名とは、研究者情報データベースにおいて、前記第1の研究者を識別する第1の研究者識別情報として用いられ、
取得ステップでは、外部の、研究情報に関するオープンソースデータから、前記第1の研究者識別情報に対応する第1の研究情報を取得し、
抽出ステップでは、前記第1の研究情報のテキスト情報に基づき、前記オープンソースデータから、前記第1の研究情報と類似し、かつ、前記第1の研究者と前記名前が一致する、第2の研究情報を抽出し、前記テキスト情報として、前記研究情報に含まれる研究課題又は要約を用い、
統合ステップでは、前記第2の研究情報に対応する第2の研究者識別情報を前記第1の研究者識別情報に統合することで、前記研究者情報データベースを生成又は更新する、システム。
【請求項2】
請求項1に記載の情報処理システムにおいて、
さらに、判定ステップでは、前記第2の研究情報と参照情報とに基づき、前記第2の研究情報に含まれる研究者が、前記第1の研究者と同一人物であることを判定する、システム。
【請求項3】
請求項1に記載の情報処理システムにおいて、
前記第1の研究者識別情報に前記第2の研究者識別情報が統合された場合に、統合された前記第1の研究者識別情報を用いて、前記取得ステップと、前記抽出ステップと、前記統合ステップとを新たに統合される前記第2の研究者識別情報がなくなるまで繰り返す、システム。
【請求項4】
請求項1に記載の情報処理システムにおいて、
前記オープンソースデータは、外部の、前記研究情報の内容種別が異なる、複数の特定内容種別オープンソースデータを含み、
前記複数の特定内容種別オープンソースデータの各々において、前記第1の研究者識別情報を用いて、前記取得ステップと、前記抽出ステップと、前記統合ステップとを新たに統合される前記第2の研究者識別情報がなくなるまで繰り返す、システム。
【請求項5】
請求項4に記載の情報処理システムにおいて、
前記複数の特定内容種別オープンソースデータは、研究予算に関する研究予算情報オープンソースデータと、学術文献に関する学術文献情報オープンソースデータと、特許文献に関する特許文献情報オープンソースデータと、共同研究に関する共同研究情報オープンソースデータとのうち、少なくとも2つを含む、システム。
【請求項6】
請求項5に記載の情報処理システムにおいて、
前記複数の特定内容種別オープンソースデータのうち、前記研究予算情報オープンソースデータを最初に用いて、前記取得ステップと、前記抽出ステップと、前記統合ステップとを実行する、システム。
【請求項7】
情報処理システムであって、
少なくとも1つのプロセッサを備え、前記少なくとも1つのプロセッサは、次の各ステップがなされるようにプログラムを実行するように構成され、
受付ステップでは、第1の研究者の名前と、前記第1の研究者が所属する所属機関名と受け付け、ここで、前記名前と前記所属機関名とは、研究者情報データベースにおいて、前記第1の研究者を識別する第1の研究者識別情報として用いられ、
取得ステップでは、外部の、研究情報に関するオープンソースデータから、前記第1の研究者識別情報に対応する第1の研究情報を取得し、
抽出ステップでは、前記第1の研究情報のテキスト情報に基づき、前記オープンソースデータから、前記第1の研究情報と類似し、かつ、前記第1の研究者と前記名前が一致する、第2の研究情報を抽出し、
統合ステップでは、前記第2の研究情報に対応する第2の研究者識別情報を前記第1の研究者識別情報に統合することで、前記研究者情報データベースを生成又は更新し、
合ステップでは、前記第1の研究者が所属する前記所属機関名に対応する研究機関の研究者の情報と、前記第1の研究者の前記名前とを照合し、
前記研究機関に前記名前が一致する研究者が一人のみであることが確認された場合には、前記第1の研究者識別情報として、前記名前と前記所属機関名を用い、
前記研究機関に前記名前が一致する研究者が複数人いることが確認された場合には、前記受付ステップにおいて、さらに、前記研究者の職位を受け付け、前記第1の研究者識別情報として、前記名前と前記所属機関名と前記職位を用いる、システム。
【請求項8】
請求項1に記載の情報処理システムにおいて、
さらに、表示制御ステップでは、ユーザから受け付けた指示に基づき、前記研究者情報データベースを検索し、検索結果を表示させる、システム。
【請求項9】
請求項に記載の情報処理システムにおいて、
さらに、分析ステップでは、前記研究者情報データベースに含まれる前記第1の研究者識別情報と前記研究情報とに基づき、研究者間の関係性を分析し、
前記表示制御ステップでは、前記関係性に関する視覚情報を表示させる、システム。
【請求項10】
請求項に記載の情報処理システムにおいて、
前記ユーザから受け付けた指示には、少なくとも特定の研究者の前記名前を含み、
さらに、提示ステップでは、前記研究者情報データベースに含まれる前記第1の研究者識別情報と前記研究情報とに基づき、前記特定の研究者に対する、共同研究先の研究者候補を提示する、システム。
【請求項11】
情報処理方法であって、
請求項1~請求項10までの何れか一つに記載の情報処理システムにおける各ステップを含む、方法。
【請求項12】
プログラムであって、
少なくとも1つのコンピュータに、請求項1~請求項10までの何れか一つに記載の情報処理システムにおける各ステップを実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1は、インターネット上に分散する様々な科学技術情報を効率的に連携し、分野や業種を越えた多様な情報間の繋がりが容易に得られる、情報提供システムを提供する文献である。この特許文献1には、複数の辞書データベース21,22,5と、これら辞書データベースを制御する演算部としてのCPU11と、を有し、辞書データベースはそれぞれ、固有の概念グループA,B,Cを有し、この概念グループに属する複数の概念を格納すると共に、個々の概念に関する名称や表記のバリエーション及びその概念を特定するための属性を個々の概念に関連づけて格納し、CPU11は、検索語が入力された際には、辞書データベース21,22,5をもとに、同一概念の別名称と、同一表記の別概念とを判別し、この検索語に関する別名称や表記のバリエーション及びその概念を特定するための属性を出力する、情報提供システムを構築することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2010-224952号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1は、検索用の辞書を充実させることにより、検索語が入力された際に、この検索語に関する別名称や表記のバリエーション及びその概念を特定することができるというものである。しかし、研究者情報を網羅的に収集する情報処理システムの技術には、未だ改善の余地がある。
【課題を解決するための手段】
【0005】
本発明の一態様によれば、情報処理システムが提供される。この情報処理システムは、少なくとも1つのプロセッサを備え、少なくとも1つのプロセッサは、次の各ステップがなされるようにプログラムを実行するように構成される。受付ステップでは、第1の研究者の名前と、第1の研究者が所属する所属機関名と受け付ける。名前と所属機関名とは、研究者情報データベースにおいて、第1の研究者を識別する第1の研究者識別情報として用いられる。取得ステップでは、外部の、研究情報に関するオープンソースデータから、第1の研究者識別情報に対応する第1の研究情報を取得する。抽出ステップでは、第1の研究情報のテキスト情報に基づき、オープンソースデータから、第1の研究情報と類似し、かつ、第1の研究者と名前が一致する、第2の研究情報を抽出する。統合ステップでは、第2の研究情報に対応する第2の研究者識別情報を第1の研究者識別情報に統合することで、研究者情報データベースを生成又は更新する。
【0006】
本発明の一つによれば、研究者情報を網羅的に収集する情報処理システムの技術として、より有益な情報処理システム等を提供することができる。
【図面の簡単な説明】
【0007】
図1】情報処理システム1を表す構成図である。
図2】サーバ2のハードウェア構成を示すブロック図である。
図3】情報処理装置3のハードウェア構成を示すブロック図である。
図4】オープンソースデータの内容種別を示す図である。
図5】情報処理システム1によって実行される処理の概要を示す図である。
図6】情報処理システム1によって実行される処理の流れの一例を示すアクティビティ図である。
図7】情報処理システム1によって使用されるオープンソースデータの一例を示す図である。
図8】研究者情報8の一例を示す図である。
図9】検索受付画面9の一例を示す図である。
図10】検索結果10の一例を示す図である。
【発明を実施するための形態】
【0008】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
【0009】
ところで、一実施形態に登場するソフトウェアを実現するためのプログラムは、コンピュータが読み取り可能な非一時的な記録媒体(Non-Transitory Computer-Readable Medium)として提供されてもよいし、外部のサーバからダウンロード可能に提供されてもよいし、外部のコンピュータで当該プログラムを起動させてクライアント端末でその機能を実現(いわゆるクラウドコンピューティング)するように提供されてもよい。
【0010】
また、一実施形態に係る種々の情報処理において、入力と、入力に応じた出力とが実現されうる。ここで、入力の結果として出力が得られれば、かかる情報処理において参照される情報(以下、参照情報と称する。)の態様は、限定されない。参照情報は、例えば、データベース、ルックアップテーブル、所定の関数(統計学的手法によって構築された、回帰式等の判定式を含む。)等のルールベースの情報でもよいし、入力と出力との相関を予め学習させた学習済みモデルでもよいし、プロンプトを入力することで所望の結果を出力可能な大規模言語モデルでもよい。
【0011】
また、一実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、一実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0又は1で構成される2進数のビット集合体としての信号値の高低、又は量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
【0012】
さらに、広義の回路とは、回路(Circuit)、回路類(Circuitry)、プロセッサ(Processor)、及びメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。また、プロセッサは、汎用プロセッサでもよいし、専用の回路でもよい。すなわち、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。
【0013】
1.ハードウェア構成
本節では、ハードウェア構成について説明する。
【0014】
<情報処理システム1>
図1は、情報処理システム1を表す構成図である。情報処理システム1は、サーバ2と、情報処理装置3とを備える。サーバ2と情報処理装置3とは、電気通信回線(ネットワーク)を通じて通信可能に構成されている。例示的な態様において、情報処理装置3は、サーバ2に対するクライアント端末として機能しうる。また、サーバ2は、電気通信回線(ネットワーク)を通じて外部のオープンソースデータ4と通信可能に構成されている。ここで、情報処理システム1に例示されるシステムとは、1つ又はそれ以上の装置又は構成要素からなるものである。したがって、サーバ2単体であっても、あるいはサーバ2と情報処理装置3との何れかであっても、情報処理システム1に含まれることに留意されたい。より詳細には、情報処理システム1は、サーバ2と情報処理装置3とからなる群より選択される要素を備えていてもよい。選択されない要素は、情報処理システム1に含まれずとも、外部の要素として、選択された要素と電気的に接続されていてもよい。以下、これらの構成要素について説明する。
【0015】
<サーバ2>
図2は、サーバ2のハードウェア構成を示すブロック図である。サーバ2は、通信部21と、記憶部22と、制御部23とを備え、これらの構成要素がサーバ2の内部において通信バス20を介して電気的に接続されている。各構成要素についてさらに説明する。
【0016】
通信部21は、USB、IEEE1394、Thunderbolt(登録商標)、有線LANネットワーク通信等といった有線型の通信手段が好ましいものの、無線LANネットワーク通信、3G/LTE/5G等のモバイル通信、BLUETOOTH(登録商標)通信等を必要に応じて含めてもよい。すなわち、これら複数の通信手段の集合として実施することがより好ましい。すなわち、サーバ2は、通信部21及びネットワークを介して、外部から種々の情報を通信してもよい。
【0017】
記憶部22は、前述の記載により定義される様々な情報を記憶する。これは、例えば、制御部23によって実行されるサーバ2に係る種々のプログラム等を記憶するソリッドステートドライブ(Solid State Drive:SSD)等のストレージデバイスとして、あるいは、プログラムの演算に係る一時的に必要な情報(引数、配列等)を記憶するランダムアクセスメモリ(Random Access Memory:RAM)等のメモリとして実施されうる。記憶部22は、制御部23によって実行されるサーバ2に係る種々のプログラムや変数等を記憶している。
【0018】
制御部23は、サーバ2に関連する全体動作の処理・制御を行う。制御部23は、例えば不図示の中央処理装置(Central Processing Unit:CPU)である。制御部23は、記憶部22に記憶された所定のプログラムを読み出すことによって、サーバ2に係る種々の機能を実現する。すなわち、記憶部22に記憶されているソフトウェアによる情報処理が、ハードウェアの一例である制御部23によって具体的に実現されることで、後述の各機能に係る各ステップが実行されうる。これらについては、次節においてさらに詳述する。なお、制御部23は単一であることに限定されず、機能ごとに複数の制御部23を有するように実施してもよい。またそれらの組合せであってもよい。
【0019】
<情報処理装置3>
図3は、情報処理装置3のハードウェア構成を示すブロック図である。情報処理装置3は、通信部31と、記憶部32と、制御部33と、表示部34と、入力部35とを備え、これらの構成要素が情報処理装置3の内部において通信バス30を介して電気的に接続されている。各構成要素についてさらに説明する。通信部31、記憶部32及び制御部33の説明は、サーバ2における各部の説明と同様のため省略する。
【0020】
表示部34は、情報処理装置3筐体に含まれるものであってもよいし、外付けされるものであってもよい。表示部34は、ユーザが操作可能なグラフィカルユーザインターフェース(Graphical User Interface:GUI)の画面を表示する。これは例えば、CRTディスプレイ、液晶ディスプレイ、有機ELディスプレイ及びプラズマディスプレイ等の表示デバイスを、情報処理装置3の種類に応じて使い分けて実施することが好ましい。
【0021】
入力部35は、情報処理装置3の筐体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部35は、表示部34と一体となってタッチパネルとして実施されてもよい。タッチパネルであれば、ユーザは、タップ操作、スワイプ操作等を入力することができる。もちろん、タッチパネルに代えて、スイッチボタン、マウス、QWERTYキーボード等を採用してもよい。すなわち、入力部35がユーザによってなされた操作入力を受け付ける。当該入力が命令信号として、通信バス30を介して制御部33に転送され、制御部33が必要に応じて所定の制御や演算を実行しうる。
【0022】
情報処理装置3として、スマートフォンやタブレット端末、パーソナルコンピュータ、ウェアラブルデバイス等を利用することができる。
【0023】
<オープンソースデータ4>
図4は、オープンソースデータの内容種別を示す図である。オープンソースデータ4は、研究情報に関するオープンソースデータである。オープンソースデータは、「誰もが利用(加工・編集等)できること」「機械判読できること」「無償で利用できること」という要件を満たすデータである。オープンソースデータ4は、内容種別が異なる、複数の研究情報に関する研究情報オープンソースデータを含む。複数の研究情報オープンソースデータの内容種別は、研究機関情報41と、研究予算情報42と、学術文献情報43と、特許文献情報44と、共同研究情報45とを含みうる。研究機関情報41のオープンソースデータは、各研究機関のホームページ上に公開されるものであってもよい。研究予算情報42と、学術文献情報43と、特許文献情報44と、共同研究情報45とに関するオープンソースデータは、公的な機関が提供するオープンソースデータを含むデータベースであってもよい。また、ここに記載した以外の内容種別のオープンソースデータが用いられてもよいし、複数の内容種別のデータを含むオープンソースデータが用いられてもよい。
【0024】
2.サーバ2の機能構成
制御部23は、例えば、以下の各ステップを実行するように構成される。以下のステップは、任意に省略可能である。
【0025】
制御部23は、受付ステップとして、情報処理装置3又は他のデバイスからの情報を受付可能に構成されている。また、制御部23は、記憶部22の少なくとも一部であるストレージ領域に記憶されている種々の情報を読み出し、読み出された情報を記憶部22の少なくとも一部である作業領域に書き込むことで、種々の情報を受付可能に構成されている。ストレージ領域とは、例えば、記憶部22のうち、SSD等のストレージデバイスとして実施される領域である。作業領域とは、例えば、RAM等のメモリとして実施される領域である。例えば、受付ステップは、第1の研究者の名前と、第1の研究者が所属する所属機関名と受け付けるステップであってもよい。受付ステップは、さらに、第1の研究者の職位に関する情報を受け付けるステップであってもよい。
【0026】
制御部23は、取得ステップとして、電気通信回線を介し外部のオープンソースデータから情報を取得可能に構成されている。例えば、制御部23は、取得ステップとして、外部の、研究情報に関するオープンソースデータから、第1の研究者識別情報に対応する第1の研究情報を取得してもよい。
【0027】
制御部23は、抽出ステップとして、電気通信回線を介し外部のオープンソースデータから情報を抽出可能に構成されている。例えば、制御部23は、抽出ステップとして、第1の研究情報のテキスト情報に基づき、オープンソースデータから、第1の研究情報と類似し、かつ、第1の研究者と名前が一致する、第2の研究情報を抽出してもよい。制御部23は、抽出ステップとして、第1の研究情報のテキスト情報から特徴量を抽出し、各テキストのベクトル表現を用いて、各テキスト情報間の類似性を計算することで、第1の研究情報と類似性が高い第2の研究情報を抽出してもよい。
【0028】
制御部23は、統合ステップとして、研究者情報データベースに記憶された第1の研究者識別情報と第1の研究者識別情報に関連する情報とを統合することができる。例えば、制御部23は、統合ステップとして、第2の研究者識別情報を第1の研究者識別情報に統合することで、研究者情報データベースを生成又は更新してもよい。
【0029】
制御部23は、判定ステップとして、複数の研究情報に含まれる研究者が、同じ研究者であるか否かを判定可能に構成される。例えば、制御部23は、判定ステップとして、第2の研究情報と参照情報とに基づき、第2の研究情報に含まれる研究者が、第1の研究者と同一人物であることを判定してもよい。具体的には、制御部23は第1の研究情報と第2の研究情報との共著者の情報の類似度に基づき、第2の研究情報に含まれる研究者が、第1の研究者と同一人物であることを判定してもよい。また、制御部23は、電気通信回線を介して、外部の研究機関情報のオープンソースデータを参照し、第2の研究情報に含まれる研究者が、第1の研究者と同一人物であることを判定してもよい。
【0030】
制御部23は、照合ステップとして、研究機関の研究者の情報と、研究者識別情報を照合可能に構成される。例えば、制御部23は、照合ステップとして、電気通信回線を介して、外部の研究機関情報のオープンソースデータを参照し、当該研究機関に同じ名前の研究者が一名のみかあるいは複数存在するかを照合してもよい。
【0031】
制御部23は、表示制御ステップとして、画面、静止画又は動画を含む画像、アイコン、メッセージ等の視覚情報を、表示部34に表示させるように制御する。制御部23は、表示部34に視覚情報を表示させるためのレンダリング情報だけを生成してもよい。例えば、制御部23は、表示制御ステップとして、ユーザから受け付けた指示に基づき、研究者情報データベースを検索し、検索結果を表示させてもよい。また、制御部23は、表示制御ステップとして、研究者間の関係性に関する視覚情報を表示させてもよい。
【0032】
制御部23は、分析ステップとして、複数の研究者情報間のネットワーク分析により、研究者間の関係性を分析可能に構成される。制御部23は、分析ステップとして、研究者情報データベースに含まれる第1の研究者識別情報と第1の研究者識別情報と関連付けられた研究情報とに基づき、研究者間の関係性を分析してもよい。また、制御部23は、分析結果に基づいて、ネットワーク構造やパターンを可視化してもよい。
【0033】
制御部23は、提示ステップとして、研究者情報データベースに含まれる第1の研究者識別情報と研究情報とに基づき、特定の研究者に対する、共同研究先の研究者候補を提示する。
【0034】
3.情報処理の流れ
本節では、情報処理システム1が実行する情報処理方法の流れについて説明する。下記に示す通り、情報処理方法は、情報処理システムが実行する各ステップを含む。本実施形態の情報処理プログラムは、コンピュータに、情報処理システムの各ステップを実行させる。なお、処理の順番は適宜入れ替えることができ、複数の処理が同時に実行されてもよいし、一部の処理が省略されてもよい。
【0035】
3.1 概要
図5は、情報処理システム1によって実行される処理の概要を示す図である。かかる処理では、まず、制御部23は、受付ステップとして第1の研究者の名前と、第1の研究者が所属する所属機関名とを受け付ける(ステップS001)。続いて、制御部23は、取得ステップとして外部の、研究情報に関するオープンソースデータから、第1の研究者識別情報に対応する第1の研究情報を取得する(ステップS002)。制御部23は、抽出ステップとして、第1の研究情報のテキスト情報に基づき、オープンソースデータから、第1の研究情報と類似し、かつ、第1の研究者と名前が一致する、第2の研究情報を抽出する(ステップS003)。続いて、制御部23は、統合ステップとして、第2の研究情報に対応する第2の研究者識別情報を第1の研究者識別情報に統合することで、前記研究者情報データベースを生成又は更新する(ステップS004)。
【0036】
以上をまとめると、一実施形態に係る、情報処理システムは、少なくとも1つのプロセッサを備え、少なくとも1つのプロセッサは、次の各ステップがなされるようにプログラムを備える。制御部23は、受付ステップとして、第1の研究者の名前と、第1の研究者が所属する所属機関名と受け付ける。名前と所属機関名とは、研究者情報データベースにおいて、第1の研究者を識別する第1の研究者識別情報として用いられる。制御部23は、取得ステップとして、外部の、研究情報に関するオープンソースデータから、第1の研究者識別情報に対応する第1の研究情報を取得する。制御部23は、抽出ステップとして、第1の研究情報のテキスト情報に基づき、オープンソースデータから、第1の研究情報と類似し、かつ、第1の研究者と名前が一致する、第2の研究情報を抽出する。制御部23は、統合ステップとして、第2の研究情報に対応する第2の研究者識別情報を第1の研究者識別情報に統合する。このような態様によれば、研究者の情報を統合した研究者情報データベースを生成又は更新することができる。
【0037】
3.2 具体例
以下、図6図10を用いて、上記情報処理の詳細について、一例として説明する。
【0038】
ところで、研究者Xの研究情報は、オープンソースデータとして公開されていることが多い。しかし、その研究情報が複数のウェブサイトやデータベースに分かれて掲載され、研究者毎に網羅的な情報がまとまっているわけではない。また、研究者は複数の研究機関を異動しながら、研究を続けていくことも多く、現在の研究者名と所属機関名のみでは、実施した過去の研究情報を取得できない場合がある。
【0039】
そこで、制御部23は、研究者Xの名前と所属する研究機関名から研究者Xの第1の研究情報をオープンソースデータから取得し、取得した第2の研究情報のテキスト情報に対して、テキスト分析を行い、研究情報に含まれるテキスト情報間の類似性を利用して、研究者Xに関する第2の研究情報を収集する。制御部23は、第2の研究情報に含まれる研究者Xの名前と所属機関名を用いて、さらに研究者Xの研究情報を収集する。本実施形態の情報処理システムは、このような処理を繰り返し、研究者Xに関する研究情報を網羅的に収集するシステムである。さらに、本実施形態の情報処理システムは、このように研究者単位で研究情報を収集し、生成又は更新された研究者情報データベースを用いて、検索や分析を行うことができる。
【0040】
図6は、情報処理システム1によって実行される処理の流れの一例を示すアクティビティ図である。流れの一例は、前述した概要に規定される範囲に包含されうる。以下、このアクティビティ図の各アクティビティに沿って、説明するものとする。なお、当該情報処理は、図示されない任意の例外処理を含みうる。例外処理は、当該情報処理の中断や、各処理の省略を含む。当該情報処理にて行われる選択又は入力は、ユーザによる操作に基づくものでも、ユーザの操作に依らず自動で行われるものでもよい。
【0041】
<研究者情報データベースへの登録>
まず、制御部23は、研究者Xの第1の研究者識別情報として、研究者Xの名前と研究者Xが所属する研究機関名とを受け付ける(アクティビティA101)。名前は漢字やアルファベットで記載されるフルネームであってもよいし、ファーストネームの最初の文字(イニシャル)とラストネームを受け付けてもよい。研究機関名は、所属機関の名称のみであってもよいし研究機関名とともに、学部名、学科名、プロジェクト名、部署名等を含むものであってもよい。
【0042】
続いて、制御部23は、照合ステップとして、第1の研究者の一例である研究者Xが所属する所属機関名に対応する研究機関の研究者の情報と、第1の研究者の名前とを照合するとよい(アクティビティA102)。研究機関に関するオープンソースデータと照合した場合に、研究者Xの研究者識別情報に一致する研究者が複数存在する場合には、アクティビティA103に進む。研究機関に名前が一致する研究者が一人のみであることが確認された場合には、第1の研究者識別情報として、名前と所属機関名を用いることができるため、アクティビティA104に進む。
【0043】
研究者識別情報に一致する研究者が複数存在する場合には、続いて、制御部23は、第1の研究者識別情報の追加情報を受け付ける(アクティビティA103)。制御部23は、第1の研究者識別情報の追加情報として、研究者Xの職位の情報を受け付けてもよい。職位とは、教授、准教授、講師、助教、助手等である。換言すると、研究機関に名前が一致する研究者が複数人いることが確認された場合には、制御部23は、受付ステップにおいて、さらに、研究者の職位を受け付け、第1の研究者識別情報として、名前と所属機関名と職位を用いるとよい。例えば、漢字記載のフルネームでも同一の研究者がいる場合がある他、海外雑誌の文献では、イニシャルとラストネームのみが著者名として掲載される場合もあり、同一研究機関に同じ名前の研究者が複数存在する場合もある。しかし、同一研究機関名かつ同一職位かつ同一名前の研究者が存在することはほとんどないため、このような態様により、第1の研究者識別情報が一人の研究者を特定する情報となる可能性が高い。
【0044】
続いて、制御部23は、第1の研究情報を取得する(アクティビティA104)。具体的には、制御部23は、取得ステップとして、外部の、研究情報に関するオープンソースデータから、第1の研究者識別情報に対応する第1の研究情報を取得する。制御部23は、第1の研究情報を取得した場合には、アクティビティA105に進む。第1の研究情報を取得できなかった場合は、アクティビティA110に進む。
【0045】
続いて、制御部23は、第1の研究情報に類似する研究情報を抽出する(アクティビティA105)。具体的には、制御部23は、抽出ステップとして、第1の研究情報のテキスト情報に基づき、オープンソースデータから、第1の研究情報と類似する研究情報を抽出する。第1の研究情報と類似するか否かの判定は、第1の研究情報のテキスト情報から特徴量を抽出し、テキスト情報のベクトル表現を用いて、オープンソースデータ内の他の研究情報との類似性を計算することにより行うことができる。制御部23は、第1の研究情報と類似する研究情報を抽出した場合には、アクティビティA106に進む。抽出される第1の研究情報と類似する研究情報がなかった場合は、アクティビティA110に進む。
【0046】
アクティビティA105において、制御部23は、抽出ステップとして、テキスト情報として、研究情報に含まれる研究課題又は要約を用いることが好ましい。制御部23は、研究情報に含まれる研究課題又は要約のテキスト情報から特徴量を抽出し、第1の研究情報と類似性が高い第2の研究情報を抽出してもよい。研究課題や要約は、研究の内容を端的に表現しており、同一の研究者の一連の研究において、類似性が高いことが多いためである。
【0047】
続いて、制御部23は、抽出された第1の研究情報と類似する研究情報に研究者Xの名前を含む第2の研究情報があるか否かを判定する(アクティビティA106)。制御部23は、研究者Xの名前を含む第2の研究情報がある場合には、アクティビティA107に進む。研究者Xの名前を含む第2の研究情報がなかった場合は、アクティビティA110に進む。
【0048】
続いて、制御部23は、判定ステップとして、第2の研究情報と参照情報とに基づき、第2の研究情報に含まれる研究者が、第1の研究者である研究者Xと同一人物であるか否かを判定してもよい(アクティビティA107)。例えば、制御部23は、すでに研究者Xと関連付けられた研究情報を参照し、研究の内容や共著者の情報に基づき、第2の研究情報に含まれる研究者が研究者Xと同一人物であるか否かを判定してもよい。このような態様により、研究者Xと同一の名前の別人の研究情報が混ざってしまうことを避けることができる。制御部23は、第2の研究情報が研究者Xのものであると判定した場合には、アクティビティA108に進む。第2の研究情報が研究者Xのものでないと判定した場合は、アクティビティA110に進む。
【0049】
続いて、制御部23は、第2の研究情報を研究者Xである第1の研究者識別情報に関連付けて保存する(アクティビティA108)。このような態様により、第1の研究情報と、第2の研究情報とは、第1の研究者識別情報と関連付けて保存される。保存される研究情報のそれぞれは、研究課題名、研究の当初採択時の採択課題、研究成果の概要、研究実施状況報告書、研究実績報告書、研究キーワード、研究代表者、研究期間、研究分野、外部資金の事業名、獲得金額、論文のキーワード、掲載雑誌名、論文の内容、論文名、特許名、特許のキーワード、共同発明者名、特許の内容等の情報を含みうる。制御部23は、報告書、学術文献、特許文献等の全文を保存してもよい。
【0050】
続いて、制御部23は、第2の研究者識別情報を第1の研究者識別情報に統合する(アクティビティA109)。このような態様により、制御部23は、研究者情報データベースを生成又は更新することができる。
【0051】
制御部23は、第2の研究者識別情報が新たに、第1の研究者識別情報に統合された場合には、アクティビティA102に戻り、新たに統合された第1の研究者識別情報に基づき、アクティビティA104-109の処理を実行する。制御部23は、アクティビティA110に進むまでアクティビティA104-109の情報処理を繰り返す。換言すると、情報処理システムでは、第1の研究者識別情報に第2の研究者識別情報が統合された場合に、統合された第1の研究者識別情報を用いて、取得ステップと、抽出ステップと、統合ステップとを新たに統合される第2の研究者識別情報がなくなるまで繰り返す。
【0052】
制御部23は、アクティビティA104-107の何れかの結果次第でアクティビティA110に進む。次の研究者Yの研究者識別情報があれば、アクティビティA101に戻る。次の研究者Yの研究者識別情報がなければ、研究者情報データベースへの登録を終了する。
【0053】
図7は、情報処理システム1によって使用されるオープンソースデータの一例を示す図である。アクティビティA102において、研究機関情報に関するオープンソースデータを使用することが好ましい。また、アクティビティA104-107において外部の、研究情報に関するオープンソースデータとして、複数の内容種別のオープンソースデータを使用することが好ましい。複数の特定の内容種別オープンソースデータとしては、例えば、研究予算に関する研究予算情報オープンソースデータと、学術文献に関する学術文献情報オープンソースデータと、特許文献に関する特許文献情報オープンソースデータと、共同研究に関する共同研究情報オープンソースデータとを用いることが好ましい。複数の特定内容種別オープンソースデータは、少なくとも2つ以上使用することがさらに好ましい。
【0054】
制御部23は、オープンソースデータのうちの一つについて、アクティビティA104-107の情報処理を行った後、別のオープンソースデータの一つについて、アクティビティA104-107の情報処理を行う。例えば、制御部23は、研究予算に関する研究予算情報オープンソースデータを用いて、アクティビティA104-107の情報処理を行った後、学術文献に関する学術文献情報オープンソースデータを用いてアクティビティA104-107の情報処理を行い、さらに、特許文献に関する特許文献情報オープンソースデータを用いてアクティビティA104-107の情報処理を行い、さらに、共同研究に関する共同研究情報オープンソースデータを用いてアクティビティA104-107の情報処理を行ってもよい。オープンソースデータを用いる順番は入れ替わってもよく、後から第2の研究者識別情報が統合された場合には、第2の研究者識別情報を統合する前に一度用いたオープンソースデータを用いて、再度アクティビティA104-107の情報処理を行ってもよい。換言すると、オープンソースデータは、外部の、研究情報の内容種別が異なる、複数の特定内容種別オープンソースデータを含む。オープンソースデータは、複数の特定内容種別オープンソースデータの各々において、第1の研究者識別情報を用いて、取得ステップと、抽出ステップと、統合ステップとを新たに統合される第2の研究者識別情報がなくなるまで繰り返すことが好ましい。このような態様により、より網羅的に研究者Xの研究情報を収集することができる。
【0055】
さらに、好ましくは、情報処理システムは、複数の特定内容種別オープンソースデータのうち、研究予算情報オープンソースデータを最初に用いて、取得ステップと、抽出ステップと、統合ステップとを実行し、その後、他の、複数の特定内容種別オープンソースデータの各々において、第1の研究者識別情報を用いて、取得ステップと、抽出ステップと、統合ステップとを新たに統合される第2の研究者識別情報がなくなるまで繰り返すことが好ましい。研究予算情報オープンソースデータは、研究者の研究課題に関して正確に記載されていることが多いためである。
【0056】
図8は、研究者情報8の一例を示す図である。研究者情報8が、研究者情報81と研究者情報82とを含む。研究者情報81と研究者情報82とは、研究者識別情報と研究情報とを含む。研究者識別情報は、項目として、例えば、研究者の名前と、研究者の所属する研究機関名と、研究者の職位を含む。研究情報は、例えば、項目として、研究者に関連する研究予算情報と、研究者に関連する特許文献情報と、研究者に関連する学術文献情報と、研究者に関連する共同研究情報とを含む。研究者情報81と研究者情報82においては、一例として、各項目1つずつ記載しているが、一人の研究者に対し、項目ごとに複数の情報が関連付けられてもよい。
【0057】
<研究者情報データベースの活用>
続いて、アクティビティA104-110により、研究者単位で研究情報が収集され、登録された研究者情報データベースを活用する方法について図6及び図9-10を用いて説明する。
【0058】
まず、制御部23は、ユーザからの指示を受け付ける(アクティビティA111)。図9は、検索受付画面9の一例を示す図である。検索受付画面9は、領域90-99と、ボタンBt1-3とを含む。領域90は、研究者名の入力を受け付ける領域である。領域91は、研究者の所属する研究機関名を受け付ける領域である。領域91は、ユーザの所属機関名を数段階で受け付けるように構成されてもよい。例えば、領域91は、大区分として大学名を受け付け、中区分として学部名を受け付け、小区分として学科名を受け付け可能に構成されてもよい。領域92は、職名を受け付け可能に構成される領域である。領域93は、研究予算の代表者名を受け付け可能に構成される領域である。領域94は、TOP10%の論文数を受付可能に構成される領域である。領域95は、総特許数を受付可能に構成される領域である。領域96は、総論文数を受付可能に構成される領域である。領域97は、国際共著者率を受付可能に構成される領域である。領域98は、検索結果のヒット件数が表示される領域である。領域99は、絞り込み検索を閉じる指示を受け付ける領域である。Bt1は、受け付けた検索条件を解除する指示を受け付けるボタンである。Bt2は、検索の実行指示を受け付けるボタンである。Bt3は、詳細検索画面の表示指示を受け付けるボタンである。なお、「詳細検索」とは、検索受付画面9以外の検索項目を受付可能に構成される。検索受付画面9はあくまでも一例であり、検索受付画面は他の検索項目により構成されてもよい。その他の検索項目としては、例えば、研究分野、論文のキーワード、掲載雑誌名、外部資金の事業名、獲得金額、特許名、特許のキーワード、共同発明者名等が挙げられる。
【0059】
続いて、制御部23は、受け付けたユーザの指示に基づく検索結果や分析結果を表示させる(アクティビティA112)。図10は、検索結果10の一例を示す図である。検索結果10は、領域101-106を含む。領域101は、検索結果のヒット件数とそのうちの現在の表示件数が表示される領域である。領域102は、表示項目の選択を受け付ける領域である。領域103は、1件目としてヒットした研究者の研究者識別情報が表示される領域である。領域104は、2件目としてヒットした研究者の研究者識別情報が表示される領域である。領域105は、1件目としてヒットした研究者の総論文数が表示される領域である。領域106は、2件目としてヒットした研究者の総論文数が表示される領域である。このように、制御部23は、表示制御ステップとして、ユーザから受け付けた指示に基づき、研究者情報データベースを検索し、検索結果を表示させてもよい。
【0060】
また、アクティビティA111において、制御部23は、ユーザからの分析指示を受け付けてもよい。研究者情報データベースにおいては、研究者単位で研究情報が一元的に整理されることで、新たな研究者間ネットワーク分析等の研究者単位の分析や、より詳細な研究機関ごとの分析、研究分野ごとの分析が可能となる。制御部23は、受け付けた分析指示に基づき分析を行い、分析結果に関する視覚情報を生成してもよい。例えば、制御部23は、分析ステップとして、研究者情報データベースに含まれる第1の研究者識別情報と研究情報とに基づき、研究者間の関係性を分析する分析指示を受け付けてもよい。制御部23は、表示制御ステップとして、関係性に関する視覚情報を表示させてもよい。研究者間の関係性としては、論文の共著者ネットワーク、論文の被引用ネットワーク、論文のテキスト分析による文章の類似度ネットワーク、外部資金の共同研究者ネットワーク、特許の共同発明者ネットワーク、特許の被引用ネットワーク、所属情報のネットワーク等を分析することができる。このような態様により、様々なネットワークを可視化することができ、研究動向を俯瞰することができる。
【0061】
また、ユーザからの分析指示は、特定の研究者の共同研究先の候補を分析する分析指示であってもよい。この場合、ユーザから受け付けた指示は、少なくとも特定の研究者の名前を含む。制御部23は、提示ステップとして、研究者情報データベースに含まれる第1の研究者識別情報と研究情報とに基づき、特定の研究者に対する、共同研究先の研究者候補を提示する。制御部23は、論文の内容、論文名、外部資金の課題名、テキスト情報、各種の研究者間ネットワークの情報、特許名、特許の内容等に基づいて、共同研究先の候補を提示してもよい。このような態様により、研究者同士の共同研究を促進することができる。
【0062】
上記実施形態では、研究者識別情報として、研究者の名前と研究機関名と職位とを用いたが、使用するオープンソースデータによっては、独自の研究者識別コードが付与されている場合がある。そのような場合には、当該研究者識別コードに紐づく研究者の名前と所属機関名とを抽出し、第1の研究者識別情報と照合し、異なる情報があれば、第1の研究者識別情報に統合してもよい。このような態様により、より網羅的に研究者識別情報及び研究情報を収集することができる。
【0063】
アクティビティA101-110の処理を研究者単位で順番に繰り返すことにより、研究者情報データベースの更新を行うことができる。定期的に更新を実行することにより、最新の情報を収載することができる。
【0064】
APIを提供しているオープンソースデータからデータを取得、抽出する場合、APIを使用することが好ましい。APIを使用することにより、効率よく、自動的にデータを収集することができる。
【0065】
図1に示す全体構成は一例であり、これに限られない。例えば、サーバ2は、2台以上の装置に分散されてもよいし、クラウドコンピューティングシステムに代替されてもよい。また、全ての処理がサーバ2で行われてもよいし、全ての処理が情報処理装置3で行われてもよい。情報処理装置3にアプリケーションをインストールし、情報処理装置3とサーバ2とが連携して上記したような処理を実行するようにしてもよい。
【0066】
サーバ2は、オンプレミス形態であってもよく、クラウド形態であってもよい。クラウド形態のサーバ2としては、例えば、SaaS(Software as a Service)、クラウドコンピューティングという形態で、上記の機能や処理を提供してもよい。
【0067】
上記実施形態では、サーバ2が種々の記憶・制御を行ったが、サーバ2に代えて、複数の外部装置が用いられてもよい。すなわち、種々の情報やプログラムは、ブロックチェーン技術等を用いて複数の外部装置に分散して記憶されてもよい。
【0068】
次に記載の各態様で提供されてもよい。
【0069】
(1)情報処理システムであって、少なくとも1つのプロセッサを備え、前記少なくとも1つのプロセッサは、次の各ステップがなされるようにプログラムを実行するように構成され、受付ステップでは、第1の研究者の名前と、前記第1の研究者が所属する所属機関名と受け付け、ここで、前記名前と前記所属機関名とは、研究者情報データベースにおいて、前記第1の研究者を識別する第1の研究者識別情報として用いられ、取得ステップでは、外部の、研究情報に関するオープンソースデータから、前記第1の研究者識別情報に対応する第1の研究情報を取得し、抽出ステップでは、前記第1の研究情報のテキスト情報に基づき、前記オープンソースデータから、前記第1の研究情報と類似し、かつ、前記第1の研究者と前記名前が一致する、第2の研究情報を抽出し、統合ステップでは、前記第2の研究情報に対応する第2の研究者識別情報を前記第1の研究者識別情報に統合することで、前記研究者情報データベースを生成又は更新する、システム。
【0070】
このような態様によれば、研究者の情報を統合した研究者情報データベースを生成又は更新することができる。
【0071】
(2)上記(1)に記載の情報処理システムにおいて、さらに、判定ステップでは、前記第2の研究情報と参照情報とに基づき、前記第2の研究情報に含まれる研究者が、前記第1の研究者と同一人物であることを判定する、システム。
【0072】
(3)上記(1)又は(2)に記載の情報処理システムにおいて、前記第1の研究者識別情報に前記第2の研究者識別情報が統合された場合に、統合された前記第1の研究者識別情報を用いて、前記取得ステップと、前記抽出ステップと、前記統合ステップとを新たに統合される前記第2の研究者識別情報がなくなるまで繰り返す、システム。
【0073】
(4)上記(1)~(3)までの何れか一つに記載の情報処理システムにおいて、前記オープンソースデータは、外部の、前記研究情報の内容種別が異なる、複数の特定内容種別オープンソースデータを含み、前記複数の特定内容種別オープンソースデータの各々において、前記第1の研究者識別情報を用いて、前記取得ステップと、前記抽出ステップと、前記統合ステップとを新たに統合される前記第2の研究者識別情報がなくなるまで繰り返す、システム。
【0074】
(5)上記(4)に記載の情報処理システムにおいて、前記複数の特定内容種別オープンソースデータは、研究予算に関する研究予算情報オープンソースデータと、学術文献に関する学術文献情報オープンソースデータと、特許文献に関する特許文献情報オープンソースデータと、共同研究に関する共同研究情報オープンソースデータとのうち、少なくとも2つを含む、システム。
【0075】
(6)上記(5)に記載の情報処理システムにおいて、前記複数の特定内容種別オープンソースデータのうち、前記研究予算情報オープンソースデータを最初に用いて、前記取得ステップと、前記抽出ステップと、前記統合ステップとを実行する、システム。
【0076】
(7)上記(1)~(6)までの何れか一つに記載の情報処理システムにおいて、さらに、照合ステップでは、前記第1の研究者が所属する前記所属機関名に対応する研究機関の研究者の情報と、前記第1の研究者の前記名前とを照合し、前記研究機関に前記名前が一致する研究者が一人のみであることが確認された場合には、前記第1の研究者識別情報として、前記名前と前記所属機関名を用い、前記研究機関に前記名前が一致する研究者が複数人いることが確認された場合には、前記受付ステップにおいて、さらに、前記研究者の職位を受け付け、前記第1の研究者識別情報として、前記名前と前記所属機関名と前記職位を用いる、システム。
【0077】
(8)上記(1)~(7)までの何れか一つに記載の情報処理システムにおいて、前記抽出ステップでは、前記テキスト情報として、前記研究情報に含まれる研究課題又は要約を用いる、システム。
【0078】
(9)上記(1)~(8)までの何れか一つに記載の情報処理システムにおいて、さらに、表示制御ステップでは、ユーザから受け付けた指示に基づき、前記研究者情報データベースを検索し、検索結果を表示させる、システム。
【0079】
(10)上記(9)に記載の情報処理システムにおいて、さらに、分析ステップでは、前記研究者情報データベースに含まれる前記第1の研究者識別情報と前記研究情報とに基づき、研究者間の関係性を分析し、前記表示制御ステップでは、前記関係性に関する視覚情報を表示させる、システム。
【0080】
(11)上記(9)又は(10)に記載の情報処理システムにおいて、前記ユーザから受け付けた指示には、少なくとも特定の研究者の前記名前を含み、さらに、提示ステップでは、前記研究者情報データベースに含まれる前記第1の研究者識別情報と前記研究情報とに基づき、前記特定の研究者に対する、共同研究先の研究者候補を提示する、システム。
【0081】
(12)情報処理方法であって、上記(1)~(11)までの何れか一つに記載の情報処理システムにおける各ステップを含む、方法。
【0082】
(13)プログラムであって、少なくとも1つのコンピュータに、上記(1)~(11)までの何れか一つに記載の情報処理システムにおける各ステップを実行させる、プログラム。
もちろん、この限りではない。
【0083】
最後に、本発明に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。当該新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。当該実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0084】
1 :情報処理システム
2 :サーバ
20 :通信バス
21 :通信部
22 :記憶部
23 :制御部
3 :情報処理装置
30 :通信バス
31 :通信部
32 :記憶部
33 :制御部
34 :表示部
35 :入力部
4 :オープンソースデータ
41 :研究機関情報
42 :研究予算情報
43 :学術文献情報
44 :特許文献情報
45 :共同研究情報
8 :研究者情報
81 :研究者情報
82 :研究者情報
9 :検索受付画面
90 :領域
91 :領域
92 :領域
93 :領域
94 :領域
95 :領域
96 :領域
97 :領域
98 :領域
99 :領域
10 :検索結果
101 :領域
102 :領域
103 :領域
104 :領域
105 :領域
106 :領域
Bt1 :ボタン
Bt2 :ボタン
Bt3 :ボタン
【要約】      (修正有)
【課題】研究者情報を網羅的に収集する情報処理システム、方法及びプログラムを提供する。
【解決手段】方法は、第1の研究者の名前と、第1の研究者が所属する所属機関名と受け付ける受付ステップを含む。名前と所属機関名とは、研究者情報データベースにおいて、第1の研究者を識別する第1の研究者識別情報として用いられる。方法はまた、外部の、研究情報に関するオープンソースデータから、第1の研究者識別情報に対応する第1の研究情報を取得する取得ステップと、第1の研究情報のテキスト情報に基づき、オープンソースデータから、第1の研究情報と類似し、かつ、第1の研究者と名前が一致する第2の研究情報を抽出する抽出ステップと、第2の研究情報に対応する第2の研究者識別情報を第1の研究者識別情報に統合することで、研究者情報データベースを生成又は更新する統合ステップと、を含む。
【選択図】図5
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10