(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024177271
(43)【公開日】2024-12-19
(54)【発明の名称】情報処理方法およびプログラム
(51)【国際特許分類】
G06F 16/28 20190101AFI20241212BHJP
【FI】
G06F16/28
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2024171981
(22)【出願日】2024-10-01
(62)【分割の表示】P 2021542614の分割
【原出願日】2020-07-15
(31)【優先権主張番号】P 2019152719
(32)【優先日】2019-08-23
(33)【優先権主張国・地域又は機関】JP
(31)【優先権主張番号】P 2020113388
(32)【優先日】2020-06-30
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000005821
【氏名又は名称】パナソニックホールディングス株式会社
(74)【代理人】
【識別番号】100109210
【弁理士】
【氏名又は名称】新居 広守
(74)【代理人】
【識別番号】100137235
【弁理士】
【氏名又は名称】寺谷 英作
(74)【代理人】
【識別番号】100131417
【弁理士】
【氏名又は名称】道坂 伸一
(72)【発明者】
【氏名】國吉 房貴
(72)【発明者】
【氏名】小澤 順
(57)【要約】
【課題】さらなる改善を図ることができる支援装置などを提供する。
【解決手段】支援装置のプロセッサが実行する情報処理方法では、ドキュメントi(i=1~n)に記述されている文章に対する自然言語処理によって、複数の出発材料から目的材料を生成する処理の条件である合成条件を示す複数の合成条件単語を含む複数の単語を抽出し、少なくとも1つの合成条件単語および少なくとも1つの単語を関連付けたデータを生成し、そのnは2以上の自然数である。
【選択図】
図17A
【特許請求の範囲】
【請求項1】
支援装置のプロセッサが実行する情報処理方法であって、
ドキュメントi(i=1~n)に記述されている文章に対する自然言語処理によって、複数の出発材料から目的材料を生成する処理の条件である合成条件を示す複数の合成条件単語を含む複数の単語を抽出し、
少なくとも1つの前記合成条件単語および少なくとも1つの単語を関連付けたデータを生成し、
前記nは2以上の自然数である、
情報処理方法。
【請求項2】
前記データは、前記少なくとも1つの前記合成条件単語および前記少なくとも1つの単語のそれぞれの前記ドキュメントiにおける出現順または位置関係に基づいて、関連付けられている、
請求項1に記載の情報処理方法。
【請求項3】
前記ドキュメントiから、前記複数の出発材料を示す複数の出発材料単語、および、前記目的材料を示す目的材料単語を含む複数の材料単語を抽出し、
前記ドキュメントiから、前記複数の出発材料から前記目的材料を生成する処理を示す複数の処理単語を抽出し、
前記複数の材料単語、前記複数の処理単語および前記複数の合成条件単語を互いに関連付けることによって、
前記複数の出発材料から前記目的材料を生成する手順を示すプロセス情報を生成する、
請求項1に記載の情報処理方法。
【請求項4】
前記ドキュメントiから抽出された前記複数の合成条件単語を用いて、前記複数の処理単語のうちの共通の処理単語に関連付けられている互いに異なる複数の合成条件を包括して示す1以上の包括合成条件を生成し、
前記複数の出発材料から前記1以上の包括合成条件を経て前記目的材料を生成する手順を示す複合プロセス情報を生成する、
請求項3に記載の情報処理方法。
【請求項5】
前記1以上の包括合成条件の生成では、前記ドキュメントiから抽出された前記複数の合成条件単語を用いたクラスタリングを行うことによって複数の部分集合を生成し、複数の部分集合ごとに複数の包括合成条件を生成する、
請求項4に記載の情報処理方法。
【請求項6】
前記ドキュメントiから、前記目的材料に関する複数の特性値を抽出し、
前記複数の部分集合ごとに対応する前記複数の特性値を包括して示す複数の包括特性値を生成し、
前記複数の包括合成条件の生成では、前記複数の包括合成条件と前記複数の包括特性値とを関連付ける、
請求項5に記載の情報処理方法。
【請求項7】
前記複数の材料単語、前記複数の処理単語および前記複数の合成条件単語を互いに関連付けることは、
前記複数の処理単語と、処理単語に関連性がある材料単語とを紐づけたデータベースを参照することによって、前記複数の材料単語と前記複数の処理単語とを互いに関連付けることを含む、
請求項3に記載の情報処理方法。
【請求項8】
前記複数の材料単語、前記複数の処理単語および前記複数の合成条件単語を互いに関連付けることは、
前記複数の処理単語と、処理単語に関連性がある合成条件単語とを紐づけたデータベースを参照することによって、前記複数の処理単語と前記複数の合成条件単語とを互いに関連付けることを含む、
請求項3に記載の情報処理方法。
【請求項9】
請求項1に記載の情報処理方法をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、合成プロセスの探索を支援する支援装置などに関する。
【背景技術】
【0002】
従来、合成プロセスの探索を支援するためのシステムが提案されている(例えば、特許文献1および2参照)。特許文献1のシステムは、合成しようとする目的化合物について与えられた、それぞれ合成プロセスに相当する複数の合成経路の中から、自動的に合成経路をランキングして絞り込んで提案する。特許文献2のシステムは、合成プロセスに相当する合成ルートを予測し、予測された多くの合成ルートの中で、経済的かつ工業的に実現可能な合成ルートを表示する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010-9257号公報
【特許文献2】特開平11-53425号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1および2におけるシステムには、さらなる改善が必要である。
【0005】
そこで、本開示は、さらなる改善を図ることができる支援装置などを提供する。
【課題を解決するための手段】
【0006】
本開示の一態様に係る支援装置は、生成装置と、分析装置とを含み、前記生成装置は、(a-1)~(a-5)をi=1~nで実行し、複数のプロセス情報であるプロセス情報1~プロセス情報nを生成し、前記iは自然数、前記nは2以上の自然数であり、前記(a-1)では、前記生成装置に備えられている材料単語抽出部が、ドキュメントiから、複数の出発材料を示す複数の出発材料単語、および、目的材料を示す目的材料単語を含む複数の材料単語を抽出し、前記(a-2)では、前記生成装置に備えられている処理単語抽出部が、前記ドキュメントiから、前記複数の出発材料から前記目的材料を生成する処理iを示す処理単語iを抽出し、前記(a-3)では、前記生成装置に備えられている条件抽出部が、前記ドキュメントiから、前記処理iの条件iである合成条件iを抽出し、前記(a-4)では、前記生成装置に備えられている特性値抽出部が、前記ドキュメントiから、前記目的材料に関する特性値iを抽出し、前記(a-5)では、前記生成装置に備えられている生成部が、前記複数の材料単語、前記処理単語i、前記合成条件i、および前記特性値iを互いに関連付けることによって、前記複数の出発材料から前記目的材料を生成する手順iを示すプロセス情報iを生成し、前記分析装置は、前記複数のプロセス情報で共通する部分、及び、前記複数のプロセス情報で異なる複数の部分を含む複合プロセス情報を生成する複合部と、前記複合プロセス情報を出力する出力部とを備える。
【0007】
なお、この包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、装置、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
【0008】
本開示の支援装置は、さらなる改善を図ることができる。本開示の一態様における更なる利点および効果は、明細書および図面から明らかにされる。かかる利点および/または効果は、いくつかの実施形態並びに明細書および図面に記載された特徴によってそれぞれ提供されるが、1つまたはそれ以上の同一の特徴を得るために必ずしも全てが提供される必要はない。
【発明の効果】
【0009】
本開示は、さらなる改善を図ることができる支援装置などを提供する。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施の形態1における合成プロセス探索支援システムのハードウェア構成の一例を示す図である。
【
図2】
図2は、実施の形態1における合成プロセス探索支援システムの機能構成の一例を示すブロック図である。
【
図3A】
図3Aは、実施の形態1における材料単語抽出部および処理単語抽出部のそれぞれで用いられる辞書を示す図である。
【
図3B】
図3Bは、実施の形態1における条件抽出部および特性値抽出部のそれぞれで用いられる辞書を示す図である。
【
図4】
図4は、実施の形態1における生成部で用いられる辞書を示す図である。
【
図5】
図5は、実施の形態1における合成プロセス生成装置のドキュメント蓄積部に蓄積されているドキュメントの一例を示す図である。
【
図6】
図6は、実施の形態1においてドキュメントの抽出対象領域から抽出される単語、合成条件および特性値の一例を示す図である。
【
図7】
図7は、実施の形態1において抽出された材料単語、処理単語、合成条件および特性値の例を示す図である。
【
図8】
図8は、実施の形態1における構造化データとして生成される合成プロセスの一例を示す図である。
【
図9】
図9は、実施の形態1における表示部に表示される合成プロセス生成画面の一例を示す図である。
【
図10】
図10は、実施の形態1における合成フローウィンドウに表示される合成フローの一例を示す図である。
【
図11】
図11は、実施の形態1における生成部によって生成されて合成プロセス蓄積部に蓄積される合成プロセスの一例を示す図である。
【
図12】
図12は、実施の形態1における表示部に表示される合成プロセス検索画面の一例を示す図である。
【
図13】
図13は、実施の形態1における表示部に表示される検索結果表示画面の一例を示す図である。
【
図14A】
図14Aは、実施の形態1において複合される合成プロセスの一例を示す図である。
【
図14B】
図14Bは、実施の形態1において複合される合成プロセスの他の例を示す図である。
【
図14C】
図14Cは、実施の形態1において複合される合成プロセスのさらに他の例を示す図である。
【
図14D】
図14Dは、実施の形態1において複合される合成プロセスのさらに他の例を示す図である。
【
図15】
図15は、実施の形態1における複合部の処理を説明するための図である。
【
図16】
図16は、実施の形態1における表示部に表示される複合画面の一例を示す図である。
【
図17A】
図17Aは、実施の形態1における合成プロセス生成装置の処理動作の一例を示すフローチャートである。
【
図17B】
図17Bは、実施の形態1における合成プロセス分析装置の処理動作の一例を示すフローチャートである。
【
図18】
図18は、実施の形態1の変形例1に係る表示部に表示される複合画面の一例を示す図である。
【
図19】
図19は、実施の形態1の変形例2に係る複合部の処理を説明するための図である。
【
図20A】
図20Aは、実施の形態1の変形例2に係る表示部に表示される複合画面の一例を示す図である。
【
図20B】
図20Bは、実施の形態1の変形例2に係る表示部に表示される複合画面の他の例を示す図である。
【
図21A】
図21Aは、実施の形態1の変形例3において複合される合成プロセスの一例を示す図である。
【
図21B】
図21Bは、実施の形態1の変形例3において複合される合成プロセスの一例を示す図である。
【
図22】
図22は、実施の形態1の変形例3に係る複合部の処理を説明するための図である。
【
図23】
図23は、実施の形態1の変形例3に係る表示部に表示される複合画面の一例を示す図である。
【
図24】
図24は、実施の形態1の変形例4に係る表示部によって表示される合成プロセス検索画面の一例を示す図である。
【
図25A】
図25Aは、実施の形態1の変形例4に係る表示部に表示される複合画面の一例を示す図である。
【
図25B】
図25Bは、実施の形態1の変形例4に係る表示部に表示される複合画面の一例を示す図である。
【
図26】
図26は、中間材料の合成を含む複合プロセス情報の一例を示す図である。
【
図27】
図27は、実施の形態2における合成プロセス探索支援システムの機能構成の一例を示すブロック図である。
【
図28】
図28は、実施の形態2における表示部に表示される複合画面の一例を示す図である。
【
図29】
図29は、実施の形態2における複合画面の入力欄への入力方法を説明するための図である。
【
図30】
図30は、実施の形態3における合成プロセス探索支援システムの機能構成の一例を示すブロック図である。
【
図31】
図31は、実施の形態3における設備情報の一例を示す図である。
【
図32】
図32は、実施の形態3における表示部に表示される複合画面の一例を示す図である。
【
図33】
図33は、実施の形態4における支援装置の概略構成の一例を示す図である。
【
図34】
図34は、実施の形態4における論文bibの内容の一例を示す図である。
【
図35】
図35は、実施の形態4における論文PDFの内容の一例を示す図である。
【
図36】
図36は、実施の形態4における論文PDFの他の内容の一例を示す図である。
【
図37】
図37は、実施の形態4における支援装置の詳細な構成の一例を示す図である。
【
図38】
図38は、実施の形態4における装置データベースに保持されているデータテーブルの一例を示す図である。
【
図39】
図39は、実施の形態4における材料データベースに保持されているデータテーブルの一例を示す図である。
【
図40】
図40は、実施の形態4におけるプロジェクトデータベースに保持されているデータテーブルの一例を示す図である。
【
図41】
図41は、実施の形態4における単位辞書データベースに保持されているデータテーブルの一例を示す図である。
【
図42】
図42は、実施の形態4における組織識別テーブルおよび著者識別テーブルの一例を示す図である。
【
図43A】
図43Aは、実施の形態4における顧客データベースに格納されるデータテーブルの一例を示す図である。
【
図43B】
図43Bは、実施の形態4における顧客データベースに格納されるデータテーブルの他の例を示す図である。
【
図43C】
図43Cは、実施の形態4における顧客データベースに格納されるデータテーブルの他の例を示す図である。
【
図44】
図44は、実施の形態4における組織データテーブルの一例を示す図である。
【
図45A】
図45Aは、実施の形態4における推定部による材料に関する推定結果の一例を示す図である。
【
図45B】
図45Bは、実施の形態4における推定部による材料に関する推定結果の他の例を示す図である。
【
図46】
図46は、実施の形態4における推定部による材料に関する推定結果の表示例を示す図である。
【
図47】
図47は、実施の形態4における推定部による材料に関する推定結果の他の例を示す図である。
【
図48】
図48は、実施の形態4における推定部による装置に関する推定結果の一例を示す図である。
【
図49】
図49は、実施の形態4における推定部による装置に関する推定結果の他の例を示す図である。
【
図50A】
図50Aは、実施の形態4における抽出部の処理の一例を示すフローチャートである。
【
図50B】
図50Bは、実施の形態4における推定部の処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0011】
(本開示の基礎となった知見)
新規材料(新規化合物ともいう)を創るためには、膨大な実験条件の組み合わせの中から合成プロセスを見つけ出す必要がある。そして、合成プロセスの探索は研究者の知識と経験に頼っているのが現状である。しかし、膨大な実験条件の中から最適な合成プロセスを発見することには、多くの時間と費用を要し、例え経験豊富な研究者であっても新規化合物の合成プロセスを発見することは容易ではない。このため合成プロセスの探索を計算機に任せることにより新規材料の開発コストを削減しようとする試みがある。計算機による合成プロセスの探索は、既知のデータベースに蓄積された材料名、実験手順、および実験条件の関係を分析することにより行われている。
【0012】
上記の合成プロセスの分析に関して、例えば、上記特許文献1には、量子化学計算部と、反応機構解析部と、合成経路ランキング部とを備える演算処理手段と、合成経路に係るデータを格納する記憶手段とを備える合成経路評価システムが開示されている。この合成経路評価システムは、合成の目的化合物に対する複数の合成経路から最適な合成経路を抽出する。
【0013】
また、上記特許文献2には、反応知識ベースに蓄積された反応ルールを適用して、市場より購入可能な化合物から標的分子を合成するルート(すなわち合成ルート)を予測する手段と、予測した各々の合成ルートごとに、出発原料から標的分子を製造するまでに要するコストの目安となる変動費指数を推算する手段と、予測した複数の合成ルートを、推算した変動費指数の小さい順に利用者に提示する手段とを備える合成ルート設計システムが開示されている。この合成ルート設計システムでは、利用者は、予測された数多くの合成ルートの中で、経済的かつ工業的に実現可能な合成ルートがどれであるかを容易に判断できる。
【0014】
しかしながら、上記各特許文献に開示されているシステム、すなわち合成プロセスの探索を支援するシステムでは、更なる改善が必要とされている。
【0015】
つまり、注目されている合成プロセスは論文などのドキュメント中に自然言語で記述されていることが多く、上記各特許文献に開示されているシステムでは、そのドキュメント中に記述されている合成プロセスを容易に利用することができない。より具体的には、毎年、材料分野では多くの論文が発行され、それらの論文中には、最新の合成プロセスが記述されている。しかし、上記各特許文献に開示されているシステムでは、それらの最新の合成プロセスを容易に利用することができないため、合成プロセスの探索を適切に支援することができない。
【0016】
このような問題を解決するために、本開示の一態様に係る支援装置は、生成装置と、分析装置とを含み、前記生成装置は、(a-1)~(a-5)をi=1~nで実行し、複数のプロセス情報であるプロセス情報1~プロセス情報nを生成し、前記iは自然数、前記nは2以上の自然数であり、前記(a-1)では、前記生成装置に備えられている材料単語抽出部が、ドキュメントiから、複数の出発材料を示す複数の出発材料単語、および、目的材料を示す目的材料単語を含む複数の材料単語を抽出し、前記(a-2)では、前記生成装置に備えられている処理単語抽出部が、前記ドキュメントiから、前記複数の出発材料から前記目的材料を生成する処理iを示す処理単語iを抽出し、前記(a-3)では、前記生成装置に備えられている条件抽出部が、前記ドキュメントiから、前記処理iの条件iである合成条件iを抽出し、前記(a-4)では、前記生成装置に備えられている特性値抽出部が、前記ドキュメントiから、前記目的材料に関する特性値iを抽出し、前記(a-5)では、前記生成装置に備えられている生成部が、前記複数の材料単語、前記処理単語i、前記合成条件i、および前記特性値iを互いに関連付けることによって、前記複数の出発材料から前記目的材料を生成する手順iを示すプロセス情報iを生成し、前記分析装置は、前記複数のプロセス情報で共通する部分、及び、前記複数のプロセス情報で異なる複数の部分を含む複合プロセス情報を生成する複合部と、前記複合プロセス情報を出力する出力部とを備える。例えば、前記処理単語抽出部は、加熱処理、混合処理、乾燥処理、および溶解処理のうちの少なくとも1つを示す前記処理単語iを抽出してもよい。または、前記条件抽出部は、それぞれ数値と単位とによって示される温度、時間、圧力、および回転数のうちの少なくとも1つを前記合成条件iとして抽出してもよい。なお、プロセス情報iと複合プロセス情報はそれぞれ、複数の出発材料から目的材料を合成するプロセスである合成プロセスを示す情報とも言える。
【0017】
これにより、複数のプロセス情報をドキュメント1~ドキュメントnから容易に生成することができる。また、生成された複数のプロセス情報から複合プロセス情報が生成されて出力されるため、その複合プロセス情報が表示される場合には、多くのプロセス情報の共通部分と、異なる部分とを分かり易く表示することができる。これにより、新たな材料の合成プロセスの探索を適切に支援することができる。
【0018】
また、それぞれ最新のドキュメントiから生成された複数のプロセス情報が組み合わされて複合プロセス情報が生成される場合には、材料開発に関する知見を最新に保つことができる。また、膨大な数のドキュメントを利用することによって、広い範囲の材料を網羅した合成プロセスの探索を支援することができる。
【0019】
また、前記複数のプロセス情報で共通の前記処理単語iに関連付けられている互いに異なる合成条件1~合成条件nが、前記異なる複数の部分である場合、前記複合部は、前記互いに異なる前記合成条件1~前記合成条件nを含む包括合成条件を生成し、前記プロセス情報iに含まれ、共通の前記処理単語iに関連付けられている合成条件iを、前記包括合成条件に置き換えることによって、前記複合プロセス情報を生成してもよい。例えば、前記互いに異なる前記合成条件1~前記合成条件nが、互いに異なる数値1~数値nをそれぞれ示す場合、前記複合部は、前記包括合成条件の生成では、前記互いに異なる数値1~数値nのうちの最小値と最大値とによって示される数値範囲を前記包括合成条件として生成してもよい。言い換えれば、前記処理単語1~前記処理単語nのうち複数の処理単語が同じ処理単語である場合、前記複合部は前記合成条件1~前記合成条件nから前記複数の処理単語に対応する複数の合成条件を含む包括合成条件を生成し、前記複数の合成条件を前記包括合成条件に置き換えて、前記複合プロセス情報を生成し、互いに異なる前記合成条件1~前記合成条件nが、数値1~数値nをそれぞれ示し、前記数値1~前記数値nのうち、最小の数値が数値pであり、最大の数値が数値qであり、前記数値pおよび前記数値qが1≦p≦n、1≦q≦n、およびp≠qを満たす場合、前記包括合成条件は、前記数値pから前記数値qであることを示してもよい。
【0020】
これにより、ドキュメント1~ドキュメントnで用いられている合成条件1~合成条件nが纏めて包括合成条件として表示されるため、その包括合成条件を見れば、新たな材料の合成プロセスを容易に探索することができる。
【0021】
また、前記互いに異なる前記合成条件1~前記合成条件nが、互いに異なる数値1~数値nをそれぞれ示す場合、前記複合部は、前記包括合成条件の生成では、前記互いに異なる数値1~数値nを含む集合に対してクラスタリングを行うことによって、複数の部分集合を生成し、前記複数の部分集合のそれぞれから前記包括合成条件を生成してもよい。
【0022】
これにより、クラスタリングによって生成された複数の包括合成条件が生成されるため、ドキュメント1~ドキュメントnで用いられている合成条件1~合成条件nの傾向をより詳細に把握することができる。
【0023】
また、前記(a-2)では、前記処理単語抽出部は、前記ドキュメントiから前記処理単語iを含む少なくとも1つの処理単語iを抽出し、前記(a-3)では、前記条件抽出部が、前記ドキュメントiから前記合成条件iを含む少なくとも1つの合成条件iを抽出し、前記複合部は、前記複合プロセス情報の生成では、材料の生成の流れが前記共通の部分から前記異なる複数の部分へそれぞれ分岐するように、前記異なる複数の部分のそれぞれを前記共通の部分に関連付けることによって、前記複合プロセス情報を生成してもよい。
【0024】
これにより、例えば複数のプロセス情報において、共通の処理単語と、互いに異なる複数の処理単語とが含まれている場合には、処理の流れが共通の処理単語の処理から互いに異なる複数の処理単語の処理へそれぞれ分岐するように、複合プロセス情報が生成される。これにより、複数のプロセス情報において互いに異なる複数の処理単語が含まれていても、共通の処理と、互いに異なる複数の処理とを分かり易く表示することができる。
【0025】
また、前記複数のプロセス情報で共通の目的材料単語が、前記共通する部分に含まれ、かつ、前記複数のプロセス情報で互いに異なる特性値1~特性値nが、前記異なる複数の部分に含まれている場合、前記複合部は、前記複合プロセス情報の生成では、さらに、前記互いに異なる特性値1~特性値nを含む包括特性値を生成し、前記プロセス情報iに含まれる前記特性値iを前記包括特性値に置き換えてもよい。
【0026】
これにより、ドキュメント1~nで用いられている合成条件1~nが異なることによって目的材料の特性値1~nが異なっていても、それらの特性値1~nが纏めて包括特性値として表示されるため、その包括特性値を見れば、新たな材料の合成プロセスを容易に探索することができる。
【0027】
また、前記分析装置は、さらに、処理の条件である入力合成条件を受け付ける合成条件入力部と、前記共通の目的材料単語の目的材料が有する前記入力合成条件に応じた特性値を推定する特性値推定部とを備え、前記出力部は、さらに、前記特性値推定部によって推定された前記特性値を出力し、前記特性値推定部は、前記複数のプロセス情報のそれぞれに含まれる前記合成条件iと、前記複数のプロセス情報のそれぞれに含まれる前記特性値iとの関係に基づいて、前記入力合成条件に応じた特性値を推定してもよい。
【0028】
これにより、ユーザが入力合成条件を設定すると、目的材料の特性値が推定されて表示されるため、例えば、新たな特性値を有する材料の合成プロセスを容易に探索することができる。
【0029】
また、前記生成装置は、前記複数のプロセス情報の生成では、前記(a-1)~前記(a-5)をi=1~mで実行し、プロセス情報1~プロセス情報mを生成し、前記mは前記n以上の自然数であり、前記分析装置は、さらに、前記生成装置によって生成されたプロセス情報1~プロセス情報mから、前記プロセス情報1~前記プロセス情報nを検索する検索部を備え、前記検索部は、前記複数の材料単語、前記処理単語i、前記合成条件i、および前記特性値iのうちの少なくとも1つを用いて前記プロセス情報1~前記プロセス情報nを検索してもよい。
【0030】
これにより、材料単語、処理単語、合成条件、および特性値のうちの少なくとも1つが共通しているプロセス情報1~プロセス情報nを検索して複合プロセス情報を生成することができる。
【0031】
また、前記生成部は、前記(a-5)では、さらに、生成された前記プロセス情報iに対して、前記ドキュメントiの書誌情報を付加し、前記検索部は、前記書誌情報をさらに用いて前記プロセス情報1~前記プロセス情報nを検索してもよい。例えば、前記書誌情報は、前記ドキュメントiの著者名、掲載日付、著者が属する組織名、および被引用数のうちの少なくとも1つを示してもよい。
【0032】
これにより、書誌情報に含まれる例えば掲載期間などが共通しているプロセス情報1~nを検索して複合プロセス情報を生成することができる。
【0033】
また、前記分析装置は、さらに、複数の設備のそれぞれについて、当該設備で実現可能な処理の条件の一覧を示す設備情報を参照することによって、前記複合部によって生成された前記包括合成条件で処理を行うことが可能な設備を検索する設備検索部を備え、前記出力部は、さらに、前記設備検索部によって検索された前記設備に関する情報を出力してもよい。
【0034】
これにより、包括合成条件で処理を行うことが可能な設備をユーザに容易に知らせることができる。その結果、材料合成に必要とされる設備を容易に手配することができる。
【0035】
また、前記生成部によって生成される前記複数のプロセス情報と、前記複合部によって生成される前記複合プロセス情報とはそれぞれ、グラフ化可能に構成され、前記出力部は、前記複合部によって生成された前記複合プロセス情報をグラフとして表示してもよい。
【0036】
これにより、複数のプロセス情報がグラフ化可能な構造化データとして構成されているため、複合プロセス情報もグラフ化可能な構造化データとして簡単に生成することができる。さらに、複合プロセス情報が例えばフローのようなグラフとして表示されるため、複合プロセス情報をユーザに適切に把握させることができる。
【0037】
また、前記複数のプロセス情報のうち、第1プロセス情報の目的材料単語と、第2プロセス情報の出発材料単語とが同一の材料単語であって、前記複数のプロセス情報で共通する部分である場合、前記複合部によって生成される前記複合プロセス情報は、前記第1プロセス情報によって示される複数の出発材料から、前記共通する部分である前記同一の材料単語によって示される材料を中間材料として合成し、さらに、前記中間材料から、前記第2プロセス情報によって示される目的材料を生成する手順を示してもよい。
【0038】
これにより、ドキュメント1~ドキュメントnの何れにも記載されていない手順を示す複合プロセス情報を生成することができる。したがって、このような複合プロセス情報が表示される場合には、新たな合成プロセスの探索をさらに支援することができる。
【0039】
また、前記支援装置は、さらに、解析装置を備え、前記解析装置は、(b-1)~(b-3)をi=1~nで実行し、複数のデータセットであるデータセット1~データセットnを生成し、前記(b-1)では、前記ドキュメントiの著者と、前記著者が属する組織とのうちの少なくとも一方に関する情報を著者関連情報iとして前記ドキュメントiから抽出し、前記(b-2)では、装置に関する情報を装置関連情報iとして前記ドキュメントiから抽出し、前記(b-3)では、前記著者関連情報iと前記装置関連情報iとを関連付けて示すデータセットiを生成してもよい。
【0040】
これにより、ドキュメント1~ドキュメントnから、データセット1~データセットnが生成される。そのデータセットiは、ドキュメントiの著者関連情報iおよび装置関連情報iを関連付けて示すため、そのデータセット1~データセットnを見れば、どの著者または組織がどのような装置を用いているかを容易に把握することができる。したがって、装置販売会社による営業活動の効率化を図ることができる。
【0041】
また、前記解析装置は、前記複数のデータセットの生成では、さらに、(b-4)をi=1~nで実行し、前記(b-4)では、材料の種別に関する情報を材料情報iとして前記ドキュメントiから抽出し、前記(b-3)では、前記材料情報iを前記著者関連情報iにさらに関連付けて示す前記データセットiを生成してもよい。
【0042】
これにより、そのデータセットiは、ドキュメントiの著者関連情報iおよび材料情報iを関連付けて示すため、そのデータセット1~データセットnを見れば、どの著者または組織がどのような材料を用いているかを容易に把握することができる。したがって、材料販売会社による営業活動の効率化を図ることができる。
【0043】
また、前記解析装置は、前記複数のデータセットの生成では、さらに、(b-5)をi=1~nで実行し、前記(b-5)では、前記材料の量に関する情報を量情報iとして前記ドキュメントiから抽出し、前記(b-3)では、前記量情報iを前記著者関連情報iにさらに関連付けて示す前記データセットiを生成してもよい。
【0044】
これにより、そのデータセットiは、ドキュメントiの著者関連情報i、材料情報iおよび量情報iを関連付けて示す。したがって、そのデータセット1~データセットnを見れば、どの著者または組織がどのような材料をどれだけ用いているかを容易に把握することができる。したがって、材料販売会社による営業活動の効率化をさらに図ることができる。
【0045】
また、前記解析装置は、前記複数のデータセットの生成では、さらに、(b-6)をi=1~nで実行し、前記(b-6)では、前記著者または前記組織を支援するプロジェクトに関する情報をプロジェクト関連情報iとして前記ドキュメントiから抽出し、前記(b-3)では、前記プロジェクト関連情報iを前記著者関連情報iにさらに関連付けて示す前記データセットiを生成してもよい。
【0046】
これにより、そのデータセットiは、ドキュメントiの著者関連情報iおよびプロジェクト関連情報を関連付けて示す。したがって、そのデータセット1~データセットnを見れば、どの著者または組織がどのようなプロジェクトによる支援を受けているかを容易に把握することができる。したがって、その著者または組織の支払能力を推定することができ、その著者または組織に対する営業活動の効率化をさらに図ることができる。
【0047】
また、本開示の一態様に係る生成装置は、材料単語抽出部と、処理単語抽出部と、条件抽出部と、特性値抽出部と、生成部とを備え、(a-1)~(a-5)をi=1~nで実行し、複数のプロセス情報であるプロセス情報1~プロセス情報nを生成し、前記iは自然数、前記nは2以上の自然数であり、前記(a-1)では、前記材料単語抽出部が、ドキュメントiから、複数の出発材料を示す複数の出発材料単語、および、目的材料を示す目的材料単語を含む複数の材料単語を抽出し、前記(a-2)では、前記処理単語抽出部が、前記ドキュメントiから、前記複数の出発材料から前記目的材料を生成する処理iを示す処理単語iを抽出し、前記(a-3)では、前記条件抽出部が、前記ドキュメントiから、前記処理iの条件iである合成条件iを抽出し、前記(a-4)では、前記特性値抽出部が、前記ドキュメントiから、前記目的材料に関する特性値iを抽出し、前記(a-5)では、前記生成部が、前記複数の材料単語、前記処理単語i、前記合成条件i、および前記特性値iを互いに関連付けることによって、前記複数の出発材料から前記目的材料を生成する手順iを示すプロセス情報iを生成する。
【0048】
これにより、複数のプロセス情報をドキュメント1~ドキュメントnから容易に生成することができる。例えば、ドキュメントに自然言語で記述されている合成プロセスから、グラフ化可能な構造化データであるプロセス情報を、容易に生成することができる。これにより、ドキュメントに記述されている合成プロセスをユーザに分かり易く提示することができる。
【0049】
また、本開示の一態様に係る分析装置は、複数のプロセス情報で共通する部分、及び、前記複数のプロセス情報で異なる複数の部分を含む複合プロセス情報を生成する複合部と、前記複合プロセス情報を出力する出力部とを備え、前記複数のプロセス情報のそれぞれは、複数の出発材料から目的材料を生成する手順を示す情報であって、前記複数の出発材料を示す複数の出発材料単語、および、前記目的材料を示す目的材料単語を含む複数の材料単語と、前記複数の出発材料から前記目的材料を生成する処理を示す処理単語と、前記処理の条件である合成条件と、前記目的材料の特性値とを互いに関連付けて示す。
【0050】
これにより、生成された複数のプロセス情報から複合プロセス情報が生成されて出力されるため、その複合プロセス情報が表示される場合には、多くのプロセス情報の共通部分と、異なる部分とを分かり易く表示することができる。これにより、新たな材料の合成プロセスの探索を適切に支援することができる。したがって、最新の多くのプロセス情報があれば、材料開発に関する知見を幅広く、かつ最新に保つことができる。
【0051】
また、上記問題を解決するために、本開示の一態様に係る合成プロセス探索支援システムは、複数のドキュメントのそれぞれについて、当該ドキュメントの記述に基づいて、複数の出発材料から目的材料を合成する処理手順である合成プロセスを生成する合成プロセス生成装置と、前記合成プロセス生成装置によって生成された複数の前記合成プロセスを分析する合成プロセス分析装置とを備え、前記合成プロセス生成装置は、前記複数のドキュメントのうちの1つの抽出対象ドキュメントから、前記複数の出発材料および前記目的材料を示す複数の材料単語を抽出する材料単語抽出部と、前記抽出対象ドキュメントから、前記複数の出発材料を用いた材料合成に適用される処理を示す処理単語を抽出する処理単語抽出部と、前記抽出対象ドキュメントから、前記処理の条件を合成条件として抽出する条件抽出部と、前記抽出対象ドキュメントから、前記目的材料の特性値を抽出する特性値抽出部と、前記抽出対象ドキュメントから抽出された前記複数の材料単語、前記処理単語、前記合成条件および前記特性値を互いに関連付けることによって前記合成プロセスを生成する生成部とを備え、前記合成プロセス分析装置は、前記合成プロセス生成装置によって生成された複数の前記合成プロセスを複合することによって、複数の前記合成プロセスで共通する部分を示し、かつ、複数の前記合成プロセスで互いに異なる複数の部分を包括して示す複合合成プロセスを生成する複合部と、前記複合部によって生成された前記複合合成プロセスを表示する表示部とを備える。例えば、前記処理単語抽出部は、加熱処理、混合処理、乾燥処理、および溶解処理のうちの少なくとも1つを示す前記処理単語を抽出してもよい。または、前記条件抽出部は、それぞれ数値と単位とによって示される温度、時間、圧力、および回転数のうちの少なくとも1つを前記合成条件として抽出してもよい。
【0052】
これにより、複数の出発材料から目的材料を合成する処理手順である合成プロセスをドキュメントから容易に生成することができる。また、生成された複数の合成プロセスから複合合成プロセスが生成されるため、多くの合成プロセスの共通部分と、互いに異なる部分とを分かり易く表示することができる。これにより、新たな材料の合成プロセスの探索を適切に支援することができる。
【0053】
また、それぞれ最新のドキュメントから生成された複数の合成プロセスが組み合わされる場合には、材料開発に関する知見を最新に保つことができる。また、膨大な数のドキュメントを利用することによって、広い範囲の材料を網羅した合成プロセスの探索を支援することができる。
【0054】
また、複数の前記合成プロセスで共通の処理単語に関連付けられている互いに異なる複数の合成条件が、前記互いに異なる複数の部分に含まれている場合、前記複合部は、前記互いに異なる複数の合成条件を包括して示す包括合成条件を生成し、複数の前記合成プロセスのうちの何れか1つの置換対象合成プロセスに含まれ、前記共通の処理単語に関連付けられている合成条件を、前記包括合成条件に置き換えることによって、前記複合合成プロセスを生成してもよい。例えば、前記互いに異なる複数の合成条件が互いに異なる複数の数値をそれぞれ示す場合、前記複合部は、前記包括合成条件の生成では、前記互いに異なる複数の数値のうちの最小値と最大値とによって示される数値範囲を前記包括合成条件として生成してもよい。
【0055】
これにより、各ドキュメントで用いられている合成条件が纏めて包括合成条件として表示されるため、その包括合成条件を見れば、新たな材料の合成プロセスを容易に探索することができる。
【0056】
また、前記互いに異なる複数の合成条件が互いに異なる複数の数値をそれぞれ示す場合、前記複合部は、前記包括合成条件の生成では、前記互いに異なる複数の数値を含む集合に対してクラスタリングを行うことによって、複数の部分集合を生成し、前記複数の部分集合のそれぞれから前記包括合成条件を生成してもよい。
【0057】
これにより、クラスタリングによって生成された複数の包括合成条件が生成されるため、各ドキュメントで用いられている合成条件の傾向をより詳細に把握することができる。
【0058】
また、前記複合部は、前記複合合成プロセスの生成では、処理の流れが前記共通の部分から前記互いに異なる複数の部分へそれぞれ分岐するように、前記互いに異なる複数の部分のそれぞれを包括的に前記共通の部分に関連付けることによって、前記複合合成プロセスを生成してもよい。
【0059】
これにより、例えば複数の合成プロセスにおいて、共通の処理単語と、互いに異なる複数の処理単語とが含まれている場合には、処理の流れが共通の処理単語の処理から互いに異なる複数の処理単語の処理へそれぞれ分岐するように、複合合成プロセスが生成される。これにより、複数の合成プロセスにおいて互いに異なる複数の処理単語が含まれていても、共通の処理と、互いに異なる複数の処理とを分かり易く表示することができる。
【0060】
また、複数の前記合成プロセスで共通の目的材料の材料単語が、前記共通する部分に含まれ、かつ、複数の前記合成プロセスで互いに異なる複数の特性値が、前記互いに異なる複数の部分に含まれている場合、前記複合部は、前記複合合成プロセスの生成では、さらに、前記互いに異なる複数の特性値を包括して示す包括特性値を生成し、前記置換対象合成プロセスに含まれる特性値を前記包括特性値に置き換えてもよい。
【0061】
これにより、各ドキュメントで用いられている合成条件が異なることによって目的材料の特性値が異なっていても、それらの特性値が纏めて包括特性値として表示されるため、その包括特性値を見れば、新たな材料の合成プロセスを容易に探索することができる。
【0062】
また、前記合成プロセス分析装置は、さらに、処理の条件である入力合成条件を受け付ける合成条件入力部と、前記共通の目的材料の前記入力合成条件に応じた特性値を推定する特性値推定部とを備え、前記表示部は、さらに、前記特性値推定部によって推定された前記特性値を表示し、前記特性値推定部は、複数の前記合成プロセスのそれぞれに含まれる合成条件と、複数の前記合成プロセスのそれぞれに含まれる特性値との関係に基づいて、前記入力合成条件に応じた特性値を推定してもよい。
【0063】
これにより、ユーザが入力合成条件を設定すると、目的材料の特性値が推定されて表示されるため、例えば、新たな特性値を有する材料の合成プロセスを容易に探索することができる。
【0064】
また、前記合成プロセス分析装置は、さらに、前記合成プロセス生成装置によって生成されたN個(Nは2以上の整数)の前記合成プロセスからM個(MはN以下の整数)の前記合成プロセスを検索する検索部を備え、前記複合部は、M個が2個以上の場合に、M個の前記合成プロセスを複合し、前記検索部は、前記材料単語、前記処理単語、前記合成条件、および前記特性値のうちの少なくとも1つを用いてM個の前記合成プロセスを検索してもよい。
【0065】
これにより、材料単語、処理単語、合成条件、および特性値のうちの少なくとも1つが共通しているM個の合成プロセスを検索して複合することができる。
【0066】
また、前記生成部は、さらに、生成された複数の前記合成プロセスのそれぞれに対して、当該合成プロセスに対応するドキュメントの書誌情報を付加し、前記検索部は、前記書誌情報をさらに用いてM個の前記合成プロセスを検索してもよい。例えば、前記書誌情報は、当該書誌情報に対応するドキュメントの著者名、掲載日付、著者が属する組織名、および被引用数のうちの少なくとも1つを示してもよい。
【0067】
これにより、書誌情報に含まれる例えば掲載期間などが共通しているM個の合成プロセスを検索して複合することができる。
【0068】
また、前記合成プロセス分析装置は、さらに、複数の設備のそれぞれについて、当該設備で実現可能な処理の条件の一覧を示す設備情報を参照することによって、前記複合部によって生成された前記包括合成条件で処理を行うことが可能な設備を検索する設備検索部を備え、前記表示部は、さらに、前記設備検索部によって検索された前記設備に関する情報を表示してもよい。
【0069】
これにより、包括合成条件で処理を行うことが可能な設備をユーザに容易に知らせることができる。その結果、材料合成に必要とされる設備を容易に手配することができる。
【0070】
また、前記生成部によって生成される複数の前記合成プロセスと、前記複合部によって生成される前記複合合成プロセスとはそれぞれ、グラフ化可能に構成され、前記表示部は、前記複合部によって生成された前記複合合成プロセスをグラフとして表示してもよい。
【0071】
これにより、複数の合成プロセスがグラフ化可能な構造化データとして構成されているため、複合合成プロセスもグラフ化可能な構造化データとして簡単に生成することができる。さらに、複合合成プロセスが例えばフローのようなグラフとして表示されるため、複合合成プロセスをユーザに適切に把握させることができる。
【0072】
また、本開示の一態様に係る合成プロセス生成装置は、ドキュメントから、複数の出発材料および目的材料を示す複数の材料単語を抽出する材料単語抽出部と、前記ドキュメントから、前記複数の出発材料を用いた材料合成に適用される処理を示す処理単語を抽出する処理単語抽出部と、前記ドキュメントから、前記処理の条件を合成条件として抽出する条件抽出部と、前記ドキュメントから、前記目的材料の特性値を抽出する特性値抽出部と、抽出された前記複数の材料単語、前記処理単語、前記合成条件および前記特性値を互いに関連付けることによって、前記複数の出発材料から前記目的材料を合成する処理手順である合成プロセスを生成する生成部と、を備える。
【0073】
これにより、複数の出発材料から目的材料を合成する処理手順である合成プロセスをドキュメントから容易に生成することができる。例えば、ドキュメントに自然言語で記述されている合成プロセスから、グラフ化可能な構造化データである合成プロセスを、容易に生成することができる。これにより、ドキュメントに記述されている合成プロセスをユーザに分かり易く提示することができる。
【0074】
また、本開示の一態様に係る合成プロセス分析装置は、複数の合成プロセスを複合することによって、前記複数の合成プロセスで共通する部分を示し、かつ、前記複数の合成プロセスで互いに異なる複数の部分を包括して示す複合合成プロセスを生成する複合部と、前記複合部によって生成された前記複合合成プロセスを表示する表示部とを備え、前記複数の合成プロセスのそれぞれは、複数の出発材料から目的材料を合成する処理手順であって、前記複数の出発材料および前記目的材料を示す複数の材料単語と、前記複数の出発材料を用いた材料合成に適用される処理を示す処理単語と、前記処理の条件である合成条件と、前記目的材料の特性値とを互いに関連付けて示す。
【0075】
これにより、生成された複数の合成プロセスから複合合成プロセスが生成されるため、多くの合成プロセスの共通部分と、互いに異なる部分とを分かり易く表示することができる。これにより、新たな材料の合成プロセスの探索を適切に支援することができる。したがって、最新の多くの合成プロセスがあれば、材料開発に関する知見を幅広く、かつ最新に保つことができる。
【0076】
なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
【0077】
以下、実施の形態について、図面を参照しながら具体的に説明する。
【0078】
なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
【0079】
また、各図は、模式図であり、必ずしも厳密に図示されたものではない。また、各図において、同じ構成部材については同じ符号を付している。
【0080】
(実施の形態1)
[合成プロセス探索支援装置]
図1は、実施の形態1における合成プロセス探索支援システムのハードウェア構成の一例を示す図である。
【0081】
本実施の形態における合成プロセス探索支援システム10は、コンピュータ310と、表示部205と、第1記録媒体331と、第2記録媒体332と、操作デバイス340とを備える。なお、本開示における合成プロセス探索支援システム10は、支援装置の具体的な一例である。
【0082】
コンピュータ310は、例えばパーソナルコンピュータなどであって、CPU(Central Processing Unit)またはプロセッサと、メモリとを備え、合成プロセスの探索を支援するための処理を実行する。本実施の形態におけるコンピュータ310は、複数の合成プロセスを生成し、それらの合成プロセスを分析する。なお、生成される合成プロセスは、複数の出発材料から目的材料を合成する処理手順を示す電子データであって、プロセス情報とも呼ばれる。また、生成される合成プロセスは、例えば、グラフ化可能に構成された構造化データである。また、出発材料は、目的材料を生成するための元となる材料であって、目的材料は、合成によって生成される材料である。
【0083】
表示部205は、コンピュータ310からの出力に応じた画像を表示する。例えば、表示部205は、コンピュータ310によって生成された合成プロセスと、複数の合成プロセスの分析結果とを表示する。
【0084】
第1記録媒体331は、例えばハードディスクであって、複数のドキュメントを保持している。これらのドキュメントは、電子データであって、例えば電子化された論文である。本実施の形態では、このような第1記録媒体331は、インターネットなどの通信ネットワーク320を介してコンピュータ310に接続されている。しかし、第1記録媒体331は、通信ネットワーク320を介することなくコンピュータ310に接続されていてもよい。なお、第1記録媒体331は、ハードディスク以外の記録媒体、例えばRAM(Random Access Memory)、ROM(Read Only Memory)、または半導体メモリなどであってもよい。また、第1記録媒体331は、揮発性であっても不揮発性であってもよい。
【0085】
第2記録媒体332は、第1記録媒体331と同様、例えばハードディスクであって、コンピュータ310によって生成された複数の合成プロセスを保持するための記録容量を有する。本実施の形態では、このような第2記録媒体332は、コンピュータ310に接続されている。しかし、第2記録媒体332は、コンピュータ310に内蔵されていてもよい。
【0086】
操作デバイス340は、例えばキーボードまたはマウスなどを含み、ユーザによって操作されることによって、その操作結果を示す信号をコンピュータ310に出力する。
【0087】
図2は、実施の形態1における合成プロセス探索支援システムの機能構成の一例を示すブロック図である。
【0088】
図2に示すように、本実施の形態における合成プロセス探索支援システム10は、合成プロセス生成装置100と、合成プロセス分析装置200とを備える。なお、本開示における合成プロセス生成装置100および合成プロセス分析装置200は、生成装置および分析装置の具体的な一例である。
【0089】
合成プロセス生成装置100は、複数の出発材料から目的材料を合成する処理手順である合成プロセスを生成する。具体的には、合成プロセス生成装置100は、複数のドキュメントのそれぞれについて、当該ドキュメントの記述に基づいて、複数の出発材料から目的材料を合成する処理手順である合成プロセスを生成する。ドキュメントは、画像データであってもよく、テキスト形式のデータであってもよい。また、ドキュメントは、PDF(Portable Document Format)形式のデータであってもよい。PDF形式のドキュメントは、テキストが埋め込まれたデータであってもよく、テキストが埋め込まれていない画像化されたデータであってもよい。
【0090】
このような合成プロセス生成装置100は、ドキュメント選択部101と、ドキュメント蓄積部102と、材料単語抽出部103と、処理単語抽出部104と、条件抽出部105と、特性値抽出部106と、生成部107とを備える。ドキュメント蓄積部102は、上述の第1記録媒体331として構成されている。また、合成プロセス生成装置100のうち、ドキュメント蓄積部102以外の各構成要素、すなわち、ドキュメント選択部101、材料単語抽出部103、処理単語抽出部104、条件抽出部105、特性値抽出部106、および生成部107は、コンピュータ310によって実現される。
【0091】
合成プロセス分析装置200は、合成プロセス生成装置100によって生成された複数の合成プロセスを分析する。本実施の形態における合成プロセス分析装置200は、複数の合成プロセスの分析では、それらの合成プロセスを複合して表示する。
【0092】
このような合成プロセス分析装置200は、合成プロセス蓄積部201と、検索条件入力部202と、検索部203と、複合部204と、表示部205とを備える。合成プロセス蓄積部201は、上述の第2記録媒体332として構成されている。また、合成プロセス分析装置200のうち、検索条件入力部202、検索部203、および複合部204は、コンピュータ310によって実現される。
【0093】
なお、
図2では、操作デバイス340は省略されているが、合成プロセス生成装置100および合成プロセス分析装置200は、操作デバイス340から出力されるユーザの操作結果を示す信号にしたがって処理を実行する。また、本実施の形態では、表示部205は、合成プロセス分析装置200に備えられているが、合成プロセス分析装置200に備えられていなくてもよい。この場合、表示部205は、合成プロセス生成装置100および合成プロセス分析装置200のうちの少なくとも一方に接続されていればよい。
【0094】
[ドキュメント蓄積部]
ドキュメント蓄積部102は、上述のように、
図1に示す第1記録媒体331として構成され、複数のドキュメントを保持している。
【0095】
[ドキュメント選択部]
ドキュメント選択部101は、ドキュメント蓄積部102に蓄積されている複数のドキュメントのそれぞれを抽出対象ドキュメントとして順に選択する。なお、ドキュメント選択部101は、予め定められた順に抽出対象ドキュメントを選択してもよく、ユーザによる操作に応じて抽出対象ドキュメントを選択してもよい。
【0096】
[材料単語抽出部]
材料単語抽出部103は、ドキュメント蓄積部102に蓄積されている複数のドキュメントのそれぞれについて、そのドキュメントから複数の材料単語を抽出し、抽出された複数の材料単語を生成部107に出力する。つまり、材料単語抽出部103は、複数のドキュメントのうちの1つの抽出対象ドキュメントから、複数の出発材料および目的材料を示す複数の材料単語を抽出する。例えば、材料単語抽出部103は、後述の辞書に記載されている材料単語を抽出対象ドキュメントから検索し、その材料単語を抽出対象ドキュメントから抽出する。
【0097】
[処理単語抽出部]
処理単語抽出部104は、ドキュメント蓄積部102に蓄積されている複数のドキュメントのそれぞれについて、そのドキュメントから少なくとも1つの処理単語を抽出し、抽出された少なくとも1つの処理単語を生成部107に出力する。つまり、処理単語抽出部104は、抽出対象ドキュメントから、複数の出発材料を用いた材料合成に適用される処理を示す処理単語を抽出する。例えば、処理単語抽出部104は、後述の辞書に記載されている処理単語を抽出対象ドキュメントから検索し、その処理単語を抽出対象ドキュメントから抽出する。具体的には、上述の処理は、例えば、加熱処理、混合処理、乾燥処理、および溶解処理のうちの少なくとも1つである。したがって、処理単語抽出部104は、加熱処理、混合処理、乾燥処理、および溶解処理のうちの少なくとも1つを示す処理単語を抽出する。
【0098】
[条件抽出部]
条件抽出部105は、ドキュメント蓄積部102に蓄積されている複数のドキュメントのそれぞれについて、そのドキュメントから処理単語に関係する合成条件を抽出し、抽出された合成条件を生成部107に出力する。つまり、条件抽出部105は、抽出対象ドキュメントから、上述の処理の条件を合成条件として抽出する。例えば、条件抽出部105は、後述の辞書に記載されている合成条件単語を抽出対象ドキュメントから検索し、その合成条件単語を含む合成条件を抽出対象ドキュメントから抽出する。具体的には、上述の合成条件は、それぞれ数値と単位とによって示される温度、時間、圧力、および回転数のうちの少なくとも1つである。したがって、条件抽出部105は、それぞれ数値と単位とによって示される温度、時間、圧力、および回転数のうちの少なくとも1つを合成条件として抽出する。
【0099】
[特性値抽出部]
特性値抽出部106は、ドキュメント蓄積部102に蓄積されている複数のドキュメントのそれぞれについて、そのドキュメントから目的材料の特性値を抽出し、抽出された特性値を生成部107に出力する。つまり、特性値抽出部106は、抽出対象ドキュメントから、目的材料の特性値を抽出する。例えば、特性値抽出部106は、後述の辞書に記載されている特性値単語を抽出対象ドキュメントから検索し、その特性値単語を含む特性値を抽出対象ドキュメントから抽出する。具体的には、特性値は、例えば、導電率、移動度、またはエネルギーなどである。
【0100】
[生成部]
生成部107は、ドキュメント蓄積部102に蓄積されている複数のドキュメントのそれぞれについて、そのドキュメントから抽出された複数の材料単語と、処理単語と、合成条件と、特性値とを関連付けることによって、合成プロセスを生成する。そして、生成部107は、その生成された合成プロセスを合成プロセス蓄積部201に出力する。つまり、生成部107は、抽出対象ドキュメントから抽出された複数の材料単語、処理単語、合成条件および特性値を互いに関連付けることによって合成プロセスを生成する。例えば、生成部107は、後述の辞書に記載されている関連性に基づいて、複数の材料単語、処理単語、合成条件および特性値を互いに関連付ける。また、生成部107は、ドキュメントにおける複数の材料単語、処理単語、合成条件および特性値のそれぞれの出現順または位置関係に基づいて、それらを関連付けてもよい。
【0101】
このように、本実施の形態における合成プロセス生成装置100である生成装置は、以下の(a-1)~(a-5)をi=1~nで実行し、複数のプロセス情報であるプロセス情報1~プロセス情報nを生成する。なお、iは自然数であり、nは2以上の自然数である。(a-1)では、生成装置に備えられている材料単語抽出部103が、ドキュメントiから、複数の出発材料を示す複数の出発材料単語、および、目的材料を示す目的材料単語を含む複数の材料単語を抽出する。(a-2)では、生成装置に備えられている処理単語抽出部104が、ドキュメントiから、複数の出発材料から目的材料を生成する処理iを示す処理単語iを抽出する。(a-3)では、生成装置に備えられている条件抽出部105が、ドキュメントiから、処理iの条件iである合成条件iを抽出する。(a-4)では、生成装置に備えられている特性値抽出部106が、ドキュメントiから、目的材料に関する特性値iを抽出する。(a-5)では、生成装置に備えられている生成部107が、複数の材料単語、処理単語i、合成条件i、および特性値iを互いに関連付けることによって、複数の出発材料から目的材料を生成する手順iを示すプロセス情報iを生成する。
【0102】
[合成プロセス蓄積部]
合成プロセス蓄積部201は、合成プロセス生成装置100によって生成された複数の合成プロセスのそれぞれについて、その合成プロセスと、その合成プロセスに対応するドキュメントの書誌情報とを関連付けて蓄積している。
【0103】
[検索条件入力部]
検索条件入力部202は、合成プロセス蓄積部201に蓄積されている複数の合成プロセスに対する検索条件を受け付ける。例えば、検索条件入力部202は、操作デバイス340から出力されるユーザの操作結果を示す信号に応じた検索条件を受け付ける。
【0104】
[検索部]
検索部203は、合成プロセス蓄積部201に蓄積されている複数の合成プロセスから、検索条件入力部202によって受け付けられた検索条件に合致する合成プロセスを検索する。つまり、検索部203は、合成プロセス生成装置100によって生成されたm個(mは2以上の整数)の合成プロセスからn個(nはm以下の整数)の合成プロセスを検索する。言い換えれば、上述の生成装置は、複数のプロセス情報の生成では、上述の(a-1)~(a-5)をi=1~mで実行し、プロセス情報1~プロセス情報mを生成する。mはn以上の自然数である。この場合に、分析装置に含まれる検索部203は、生成装置によって生成されたプロセス情報1~プロセス情報mから、プロセス情報1~プロセス情報nを検索する。
【0105】
[複合部]
複合部204は、検索部203によって検索された合成プロセスの数、すなわちn個が2個以上の場合に、そのn個の合成プロセスを複合する。つまり、複合部204は、合成プロセス生成装置100によって生成されたn個の合成プロセスを複合することによって、n個の合成プロセスで共通する部分を示し、かつ、n個の合成プロセスで互いに異なる複数の部分を包括して示す複合合成プロセスを生成する。なお、複合合成プロセスは、合成プロセスと同様、複数の出発材料から目的材料を合成する処理手順を示す電子データであって、複合プロセス情報とも呼ばれる。また、本開示において、複数の合成プロセスを複合するとは、複数のプロセス情報から複合プロセス情報を生成することを意味する。
【0106】
[表示部]
表示部205は、例えば液晶ディスプレイ、プラズマディスプレイ、または有機EL(Electro-Luminescence)ディスプレイなどとして構成されている。このような表示部205は、複合部204によって生成された複合合成プロセスを表示する。なお、本開示において表示部205は、出力部の具体的な一例である。つまり、本実施の形態における表示部205は、その複合合成プロセス、すなわち複合プロセス情報を画像として表示することによって、その複合プロセス情報を出力する。しかし、複合プロセス情報は、音声によって出力されてもよく、電子データとして他の装置に出力されてもよい。
【0107】
[辞書]
図3Aは、材料単語抽出部103および処理単語抽出部104のそれぞれで用いられる辞書を示す図である。
図3Bは、条件抽出部105および特性値抽出部106のそれぞれで用いられる辞書を示す図である。
【0108】
材料単語抽出部103は、
図3Aの(a)に示す材料単語辞書を有する。材料単語辞書は、複数の材料単語と、それらの材料単語の属性とを示す。材料単語の属性は、出発材料または目的材料である。例えば、材料単語辞書は、材料単語「Li
2CO
3」と、その材料単語の属性「出発材料」とを示す。また、材料単語辞書は、材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」と、その材料単語の属性「目的材料」とを示す。材料単語抽出部103は、この材料単語辞書に示されている材料単語をドキュメントから検索し、その材料単語をドキュメントから抽出する。このとき、材料単語抽出部103は、その抽出された材料単語の属性を、材料単語辞書を参照することによって特定し、その材料単語に付加する。そして、材料単語抽出部103は、属性が付加された材料単語を生成部107に出力する。
【0109】
処理単語抽出部104は、
図3Aの(b)に示す処理単語辞書を有する。処理単語辞書は、複数の処理単語と、それらの処理単語の属性とを示す。例えば、処理単語辞書は、処理単語「heat」と、その処理単語の属性「加熱処理」とを示す。また、処理単語辞書は、処理単語「mix」と、その処理単語の属性「混合処理」とを示す。処理単語抽出部104は、この処理単語辞書に示されている処理単語をドキュメントから検索し、その処理単語をドキュメントから抽出する。このとき、処理単語抽出部104は、その抽出された処理単語の属性を、処理単語辞書を参照することによって特定し、その処理単語に付加する。そして、処理単語抽出部104は、属性が付加された処理単語を生成部107に出力する。
【0110】
ここで、処理単語抽出部104は、処理単語辞書に示されている処理単語をドキュメントから検索するときには、その処理単語そのものを検索するだけでなく、その処理単語の活用形および派生形の少なくとも一方も検索してもよい。また、処理単語抽出部104は、処理単語辞書に示されている処理単語の語幹を検索し、その語幹を有する単語を処理単語として抽出してもよい。例えば、処理単語抽出部104は、処理単語辞書に示される処理単語「heat」を検索するだけでなく、「heated」および「heating」なども検索する。また、処理単語抽出部104は、処理単語辞書に示される処理単語「mix」を検索するだけでなく、「mixtures」なども検索する。また、処理単語抽出部104は、処理単語辞書に示される処理単語の文字の形態(例えば、大文字、小文字、またはフォントなど)に関わらず、その処理単語をドキュメントから検索してもよい。
【0111】
条件抽出部105は、
図3Bの(a)に示す条件単語辞書を有する。条件単語辞書は、複数の合成条件単語と、それらの合成条件単語の属性および例とを示す。例えば、条件単語辞書は、合成条件単語「℃」と、その合成条件単語の属性「温度」および例「at 900℃」とを示す。さらに、例えば、条件単語辞書は、合成条件単語「K」と、その合成条件単語の属性「温度」および例「at 300-400K」とを示す。また、条件単語辞書は、合成条件単語「Room Temperature」と、その合成条件単語の属性「温度」および例「at room temperature」とを示す。
【0112】
条件抽出部105は、この条件単語辞書に示されている合成条件単語をドキュメントから検索し、その合成条件単語を含む合成条件をドキュメントから抽出する。具体的には、条件抽出部105は、条件単語辞書に示される合成条件単語の例に数値が用いられていれば、その合成条件単語と、その合成条件単語の周辺にある数値とからなる合成条件をドキュメントから抽出する。例えば、条件単語辞書に、合成条件単語「K」の例として「at 300-400K」が示されていれば、条件抽出部105は、合成条件単語「K」と、その直前にある数値とからなる合成条件をドキュメントから抽出する。なお、数値には、「100M」などのように、「M」などの10のべき乗が含められてもよい。
【0113】
一方、条件抽出部105は、条件単語辞書に示される合成条件単語の例に数値が用いられていなければ、その合成条件単語を合成条件としてドキュメントから抽出する。例えば、条件単語辞書に、合成条件単語「Room Temperature」の例として「at room temperature」が示されていれば、条件抽出部105は、合成条件単語「room temperature」を合成条件としてドキュメントから抽出する。つまり、このときには、条件抽出部105は数値の抽出を行わない。また、条件抽出部105は、条件単語辞書に示される合成条件単語の文字の形態(例えば、大文字、小文字、またはフォントなど)に関わらず、その合成条件単語をドキュメントから検索してもよい。
【0114】
なお、条件単語辞書には、合成条件単語に用いられる数値のレンジが示されていてもよい。この場合には、条件抽出部105は、そのレンジ内の数値を含む合成条件を検索して抽出する。
【0115】
さらに、条件抽出部105は、その抽出された合成条件に含まれる合成条件単語の属性を、条件単語辞書を参照することによって特定し、その合成条件に付加する。そして、条件抽出部105は、属性が付加された合成条件を生成部107に出力する。
【0116】
特性値抽出部106は、
図3Bの(b)に示す特性値辞書を有する。特性値辞書は、複数の特性値単語を示す。特性値単語は、特性値を示すための単位である。例えば、特性値辞書は、特性値単語「S/cm」、「cm
2/V」、および「eV」などを示す。
【0117】
特性値抽出部106は、この特性値辞書に示されている特性値単語をドキュメントから検索し、その特性値単語と、その特性値単語の直前にある数値とを含む特性値をドキュメントから抽出する。例えば、特性値抽出部106は、特性値単語「S/cm」と、その直前にある数値とからなる特性値をドキュメントから抽出する。または、特性値抽出部106は、特性値単語「eV」と、その直前にある数値とからなる特性値をドキュメントから抽出する。そして、条件抽出部105は、その抽出された特性値を生成部107に出力する。
【0118】
図4は、生成部107で用いられる辞書を示す図である。
【0119】
生成部107は、
図4の(a)に示す第1関連性辞書を有する。第1関連性辞書は、複数の処理単語と、それらの処理単語に関連性がある材料の属性とを示す。材料の属性は、出発材料または目的材料である。例えば、第1関連性辞書は、処理単語「mix」と、その処理単語に関連性がある材料の属性「出発材料」とを示す。生成部107は、この
図4の(a)に示す第1関連性辞書を参照することによって、ドキュメントから抽出された処理単語と材料単語とを関連付ける。
【0120】
生成部107は、
図4の(b)に示す第2関連性辞書を有する。第2関連性辞書は、複数の処理単語と、それらの処理単語に関連性がある合成条件の属性とを示す。1つの処理単語に関連性がある合成条件の属性は、1つではなく、複数あってもよい。例えば、第2関連性辞書は、処理単語「heat」と、その処理単語「heat」に関連性がある合成条件の属性1「温度」および属性2「時間」とを示す。
【0121】
生成部107は、この
図4の(b)に示す第2関連性辞書を参照することによって、ドキュメントから抽出された処理単語と合成条件とを関連付ける。
【0122】
[合成プロセスの生成]
図5は、合成プロセス生成装置100のドキュメント蓄積部102に蓄積されているドキュメントの一例を示す図である。
【0123】
ドキュメント蓄積部102には、
図5に示すように例えば電子化された複数の論文がそれぞれドキュメントとして蓄積されている。ドキュメント選択部101は、複数のドキュメントのうちの何れか1つを抽出対象ドキュメントとして選択する。そして、ドキュメント選択部101は、その抽出対象ドキュメントから抽出対象領域を特定する。例えば、ドキュメント選択部101は、予め定められている項目名が記されている領域を抽出対象領域として特定する。または、ドキュメント選択部101は、
図3Aまたは
図3Bに示す辞書に示されている単語を検索し、その単語の出現頻度が最も多い領域、またはその出現頻度が閾値よりも多い領域を、抽出対象領域として特定してもよい。または、抽出対象領域は、ドキュメントに予め設定されていてもよく、ユーザによって任意に設定されてもよい。
【0124】
ドキュメント選択部101は、その抽出対象領域が明示的に示された抽出対象ドキュメントを材料単語抽出部103、処理単語抽出部104、条件抽出部105、および特性値抽出部106に出力する。抽出対象領域を明示的に示すために、例えば、タグ、または、ページ番号および行数が用いられてもよい。つまり、抽出対象ドキュメントにおいて、抽出対象領域の始点と終点とを示す情報がタグなどによって示されていてもよく、その始点と終点とを示す情報がページ番号および行数などによって示されていてもよい。
【0125】
なお、
図5に示す抽出対象領域では、その抽出対象領域に記載されている内容を分かり易く示すため、その抽出対象領域に含まれる各文の先頭に対して、その文の出現順に番号が付されている。
【0126】
図6は、ドキュメントの抽出対象領域から抽出される単語、合成条件および特性値の一例を示す図である。
【0127】
例えば、ドキュメント選択部101によって
図5に示す抽出対象領域が特定された場合、材料単語抽出部103は、
図3Aの(a)に示す材料単語辞書を参照することによって、その抽出対象領域から材料単語を抽出する。例えば、材料単語抽出部103は、目的材料の材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」と、出発材料の材料単語「Li
2CO
3」、「MgO」、「TiO
2」および「NH
4H
2PO
4」とを抽出する。
【0128】
また、処理単語抽出部104は、
図3Aの(b)に示す処理単語辞書を参照することによって、その抽出対象領域から処理単語を抽出する。例えば、処理単語抽出部104は、処理単語「mixtures」および「milled」などを抽出する。
【0129】
また、条件抽出部105は、
図3Bの(a)に示す条件単語辞書を参照することによって、その抽出対象領域から合成条件を抽出する。例えば、条件抽出部105は、合成条件「20h」、「334K」および「6h」などを抽出する。
【0130】
また、特性値抽出部106は、
図3Bの(b)に示す特性値辞書を参照することによって、その抽出対象領域から目的材料の特性値を抽出する。例えば、特性値抽出部106は、特性値「0.00013S/cm」を抽出する。
【0131】
図7は、抽出された材料単語、処理単語、合成条件および特性値の例を示す図である。
【0132】
例えば、
図7の(a)に示すように、属性「目的材料」を有する材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」と、属性「出発材料」を有する材料単語「Li
2CO
3」、「MgO」、「TiO
2」および「NH
4H
2PO
4」とが抽出される。
【0133】
なお、材料単語抽出部103は、
図3Aの(a)の材料単語辞書に示されていない材料単語を抽出してもよい。この場合、材料単語抽出部103は、ドキュメントの文章を単語単位で区切り、その文章の構造から材料単語を抽出してもよい。また、材料単語抽出部103は、ドキュメントに記述されている材料単語に変数が含まれているときは、変数に数値が代入された材料単語を抽出してもよい。例えば、ドキュメントに「Li
4Ti
(5-x)La
(x)O
12 [x=0, 0.05, 0.1]」が記述されている場合、材料単語抽出部103は、xに0, 0.05, 0.1を代入し、材料単語「Li
4Ti
5O
12」、「Li
4Ti
4.95La
0.05O
12」、および「Li
4Ti
4.9La
0.1O
12」を抽出する。
【0134】
また、
図7の(b)に示すように、処理単語「mixtures」、「heating」および「milled」などが抽出される。なお、これらの抽出された処理単語には、その処理単語の属性が付加されている。また、
図7の(c)に示すように、合成条件「20h」、「773K」および「5h」などが抽出される。なお、これらの抽出された合成条件には、その合成条件の属性が付されている。さらに、
図7の(c)に示すように、特性値「1.30×10
-4S/cm」が抽出される。
【0135】
なお、材料単語抽出部103、処理単語抽出部104、条件抽出部105、および特性値抽出部106などの各抽出部は、ドキュメントに記述されている文章に対する形態素解析、構文解析、文脈解析などの自然言語処理を行ってもよい。つまり、このような自然言語処理によって各単語、合成条件、および特性値が検索されて抽出されてもよい。また、ドキュメントが画像データである場合には、各抽出部は、その画像データに対してOCR(Optical Character Recognition/Reader)を行うことによって、その画像データをテキストデータに変換し、そのテキストデータから各単語などを抽出してもよい。または、各抽出部は、画像認識によって各単語などを抽出してもよく、機械学習を用いて各単語などを抽出してもよい。
【0136】
図8は、構造化データとして生成される合成プロセスの一例を示す図である。
【0137】
生成部107は、
図7に示す材料単語、処理単語、合成条件および特性値を用いて合成プロセスを生成する。この合成プロセスは、構造化データであって、グラフ化可能に構成されている。なお、生成部107は、
図7のように抽出された処理単語そのものを合成プロセスに用いてもよく、その抽出された処理単語の原形、すなわち、
図3Aの(b)の処理単語辞書に示される処理単語を合成プロセスに用いてもよい。
【0138】
具体的には、生成部107は、
図8の(a)に示すように、抽出された材料単語、処理単語、および合成条件のそれぞれに対して単語ID(例えばW1およびW2など)を割り当てる。なお、抽出された材料単語、処理単語、および合成条件のそれぞれには、属性が付されている。
【0139】
さらに、生成部107は、上述のように割り当てられた複数の単語IDから1つの単語IDを選択し、その選択された単語IDと関連性を有する単語IDを検索する。そして、生成部107は、
図8の(b)に示すように、その選択された単語IDと、検索された単語IDとを関連付け、関連付けられた単語IDのペアに対して関係IDを割り当てる。
【0140】
例えば、生成部107は、この
図4の(a)に示す第1関連性辞書を参照することによって、ドキュメントから抽出された処理単語の単語IDと材料単語の単語IDとを関連付ける。具体的には、生成部107は、処理単語抽出部104によってドキュメントから抽出された処理単語「mixtures」を選択する。次に、生成部107は、第1関連性辞書から、その処理単語「mixtures」の原形である処理単語「mix」を検索する。そして、生成部107は、第1関連性辞書を参照することによって、その処理単語「mix」に関連性がある材料の属性として「出発材料」を特定する。ここで、抽出されている各材料単語には、
図8の(a)に示すように、その材料単語の属性が付加されている。
【0141】
したがって、生成部107は、抽出された複数の材料単語のうち、その特定された属性「出発材料」が付加されている材料単語を、選択された処理単語「mixtures」に関連付ける。このとき、生成部107は、それぞれ属性「出発材料」を有する複数の材料単語のうち、ドキュメントに含まれる文において、その選択された処理単語「mixtures」から前後方向にそれぞれ所定の単語数以内にある材料単語のみを、その選択された処理単語「mixtures」に関連付けてもよい。例えば、生成部107は、属性「出発材料」を有する材料単語「Li
2CO
3」を、選択された処理単語「mixtures」に関連付ける。これにより、
図8の(b)に示すように、材料単語「Li
2CO
3」の単語ID「W1」と、処理単語「mixtures」の原形である処理単語「mix」の単語ID「W5」とが関連付けられる。生成部107は、これらの単語ID「W1」と単語ID「W5」とのペアに対して関係ID「R1」を割り当てる。
【0142】
また、生成部107は、この
図4の(b)に示す第2関連性辞書を参照することによって、ドキュメントから抽出された処理単語の単語IDと合成条件の単語IDとを関連付ける。具体的には、生成部107は、処理単語抽出部104によってドキュメントから抽出された処理単語「mixtures」を選択する。次に、生成部107は、第2関連性辞書から、その処理単語「mixtures」の原形である処理単語「mix」を検索する。そして、生成部107は、第2関連性辞書を参照することによって、その処理単語「mix」に関連性がある合成条件の属性として「温度」および「時間」を特定する。ここで、抽出されている各合成条件には、
図8の(a)に示すように、その合成条件の属性が付加されている。
【0143】
したがって、生成部107は、抽出された複数の合成条件のうち、その特定された属性「温度」が付加されている合成条件を、選択された処理単語「mixtures」に関連付ける。このとき、生成部107は、それぞれ属性「温度」を有する複数の合成条件のうち、ドキュメントに含まれる文において、その選択された処理単語「mixtures」から前後方向にそれぞれ所定の単語数以内にある合成条件のみを、その選択された処理単語「mixtures」に関連付けてもよい。例えば、生成部107は、属性「温度」を有する合成条件「773K」を、選択された処理単語「mixtures」に関連付ける。これにより、
図8の(b)に示すように、合成条件「773K」の単語ID「W7」と、処理単語「mixtures」の原形である処理単語「mix」の単語ID「W5」とが関連付けられる。生成部107は、これらの単語ID「W7」と単語ID「W5」とのペアに対して関係ID「R6」を割り当てる。このような処理と同様に、生成部107は、抽出された複数の合成条件のうち、その特定された属性「時間」が付加されている合成条件を、選択された処理単語「mixtures」に関連付ける。これにより、
図8の(b)に示すように、合成条件「20h」の単語ID「W6」と、処理単語「mixtures」の原形である処理単語「mix」の単語ID「W5」とが関連付けられる。生成部107は、これらの単語ID「W6」と単語ID「W5」とのペアに対して関係ID「R5」を割り当てる。
【0144】
また、生成部107は、ドキュメントから抽出された処理単語の単語IDと、その処理単語の次に出現する処理単語の単語IDとを関連付ける。具体的には、生成部107は、処理単語抽出部104によってドキュメントから抽出された処理単語「mixtures」を選択する。次に、生成部107は、ドキュメントから抽出された複数の処理単語のうち、そのドキュメントにおいてその処理単語「mixtures」の次に出現する処理単語「heating」を選択する。そして、生成部107は、処理単語「mixtures」の原形である処理単語「mix」と、処理単語「heating」の原形である処理単語「heat」とを関連付ける。これにより、
図8の(b)に示すように、処理単語「mix」の単語ID「W5」と、処理単語「heat」の単語ID「W8」とが関連付けられる。生成部107は、これらの単語ID「W5」と単語ID「W8」とのペアに対して関係ID「R7」を割り当てる。ドキュメントにおいて、処理単語「heating」の次に処理単語「milled」が出現する場合には、上述の処理と同様、生成部107は、処理単語「heating」の原形である処理単語「heat」と、処理単語「milled」の原形である処理単語「mill」とを関連付ける。これにより、
図8の(b)に示すように、処理単語「mill」の単語ID「W11」と、処理単語「heat」の単語ID「W8」とが関連付けられる。生成部107は、これらの単語ID「W11」と単語ID「W8」とのペアに対して関係ID「R10」を割り当てる。
【0145】
また、生成部107は、
図8の(c)に示すように、抽出された特性値に対して特性値IDを割り当てる。例えば、抽出された特性値「1.30×10
-4S/cm」に対して特性値ID「V1」が割り当てられる。また、生成部107は、このような特性値IDを、属性「目的材料」を有する材料単語の単語IDに関連付ける。なお、ドキュメントにおいて、それぞれ属性「目的材料」を有する複数の材料単語と、複数の特性値とが複数存在する場合、生成部107は、それらの材料単語が出現する順番に基づき、その材料単語と特性値とを関連付ける。例えば、ドキュメントに「ionic conductivity of Li
4Ti
5O
12,Li
4Ti
0.95La
0.05O
12, and Li
4Ti
4.9La
0.1O
12 were 0.1, 0.35, and 0.56 S/cm」という文章がある。この場合、生成部107は、属性「目的材料」を有する各材料単語が出現する順番に基づき、その材料単語「Li
4Ti
5O
12」と特性値「0.1S/cm」とを関連付け、材料単語「Li
4Ti
0.95La
0.05O
12」と特性値「0.35S/cm」とを関連付ける。さらに、生成部107は、材料単語「Li
4Ti
4.9La
0.1O
12」と特性値「0.56S/cm」とを関連付ける。
【0146】
また、複数の出発材料からA材料が合成され、次にB材料が合成され、さらに次にC材料が合成されることがドキュメントに記述されている場合には、A材料およびB材料は、中間材料であって、C材料は目的材料である。しかし、A材料およびB材料のそれぞれの材料単語も、材料単語抽出部103によって目的材料の材料単語として抽出されてもよい。この場合にも、ドキュメントには、それぞれ属性「目的材料」を有する複数の材料単語と、複数の特性値とが複数存在する。したがって、生成部107は、上述と同様に、それらの材料単語が出現する順番に基づき、その材料単語と特性値とを関連付けてもよい。
【0147】
なお、生成部107は、上述の各抽出部と同様に、自然言語処理を行うことによって、処理単語と材料単語とを関連付けたり、処理単語と合成条件とを関連付けたりしてもよい。また、生成部107は、ドキュメントに記述されている言語の種類(例えば、日本語または英語など)に応じて、関連付けの手法を切り換えてもよい。例えば、生成部107は、ドキュメントに記述されている言語が英語である場合、そのドキュメントに記述されている処理単語に相当する動詞の後に名詞が続いていれば、その処理単語と、その名詞に相当する材料単語とを関連付けてもよい。一方、生成部107は、ドキュメントに記述されている言語が日本語である場合、そのドキュメントに記述されている処理単語に相当する動詞の前に名詞があれば、その処理単語と、その名詞に相当する材料単語とを関連付けてもよい。
【0148】
図9は、表示部205に表示される合成プロセス生成画面の一例を示す図である。
【0149】
ドキュメント選択部101は、例えば、操作デバイス340から出力されるユーザの操作結果を示す信号に応じで、
図9に示す合成プロセス生成画面1aを表示部205に表示させる。
【0150】
合成プロセス生成画面1aは、一覧ウィンドウ1bと、書誌ウィンドウ1cと、合成フローウィンドウ1dと、生成開始ボタン1eと、保存ボタン1fとを含む。
【0151】
一覧ウィンドウ1bには、ドキュメント蓄積部102に蓄積されているドキュメントの一覧が表示される。生成開始ボタン1eは、合成プロセスの生成開始を指示するためのボタンである。例えば、ユーザは、操作デバイス340を操作することによって、その一覧ウィンドウ1bに表示されているファイル名「0001」のドキュメントを選択する。そして、ユーザは操作デバイス340を操作することによって、生成開始ボタン1eを選択する。その結果、ドキュメント選択部101は、ドキュメント蓄積部102に蓄積されている複数のドキュメントからファイル名「0001」のドキュメントを抽出対象ドキュメントとして選択する。さらに、ドキュメント選択部101は、その抽出対象ドキュメントを材料単語抽出部103、処理単語抽出部104、条件抽出部105、および特性値抽出部106に出力する。これにより、抽出対象ドキュメントからの合成プロセスの生成が実行される。
【0152】
書誌ウィンドウ1cには、抽出対象ドキュメントの書誌情報が表示される。例えば、ドキュメント選択部101は、抽出対象ドキュメントから書誌情報を抽出し、その書誌情報を書誌ウィンドウ1cに表示させる。書誌情報は、例えば、掲載雑誌名、掲載日付、著者名、およびタイトルなどを含む。また、抽出対象ドキュメントが論文である場合、書誌情報は、その論文に割り付けられた論文IDを含んでいてもよい。この場合、ドキュメントのファイル名は、論文IDであってもよい。
【0153】
合成フローウィンドウ1dには、生成された合成プロセスがグラフ化されて表示される。このグラフ化された合成プロセスを、以下、合成フローという。例えば、生成部107は、
図8に示す合成プロセスを生成すると、その合成プロセスを合成フローとして合成フローウィンドウ1dに表示させる。この合成フローは、複数の出発材料に対して少なくとも1つの処理が行われて目的材料が生成される処理手順をフロー図として示す。さらに、合成フローは、それらの各処理に用いられる合成条件と、目的材料の特性値とを示す。
【0154】
保存ボタン1fは、生成された合成プロセスを保存するためのボタンである。例えば、合成フローウィンドウ1dに合成フローが表示されているときに、ユーザは、操作デバイス340を操作することによって、その保存ボタン1fを選択する。これにより、生成部107は、その操作結果を示す信号を操作デバイス340から取得し、その信号に応じて、生成された合成プロセスを合成プロセス蓄積部201に出力する。これにより、合成プロセス蓄積部201には、その生成された合成プロセスが蓄積または保存される。
【0155】
なお、
図9に示す例では、ユーザによって選択されたドキュメントから合成プロセスが生成されるが、ドキュメント蓄積部102に蓄積されている各ドキュメントから自動的に合成プロセスが生成されて合成プロセス蓄積部201に蓄積されてもよい。
【0156】
図10は、合成フローウィンドウ1dに表示される合成フローの一例を示す図である。
【0157】
合成フローは、複数の出発材料の材料単語と、少なくとも1つの処理単語と、それらの処理単語の処理に用いられる合成条件と、目的材料の材料単語と、その目的材料の特性値とを含む。
図10に示す合成フローは、例えば
図8に示す合成プロセスがグラフ化されたフローである。つまり、
図10に示す例では、複数の出発材料の材料単語は、「Li
2CO
3」、「MgO」、「TiO
2」および「NH
4H
2PO
4」である。また、少なくとも1つの処理単語は、処理単語「mix」、「heat」、「mill」、「dry」、「press」および「sinter」である。複数の出発材料のそれぞれの材料単語は、例えば直線によって処理単語「mix」に関連付けられる。そして、
図10に示す例のように、合成フローに複数の処理単語が含まれる場合には、それらの複数の処理単語は、矢印によって関連付けられる。
【0158】
また、各処理単語には、合成条件が関連付けられている。例えば、処理単語「mix」に対しては、合成条件「20h」および「773K」が関連付けられ、処理単語「heat」に対しては、合成条件「5h」および「1223K」が関連付けられる。そして、それらの複数の処理単語のうちの最後の処理単語に、目的材料の材料単語が関連付けられる。
図10に示す例では、目的材料の材料単語は、「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」である。つまり、最後の処理単語「sinter」から材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」に向かう矢印によって、その最後の処理単語と目的材料の材料単語とが関連付けられる。
【0159】
そして、その目的材料の材料単語の周囲には、特性値が配置される。例えば、特性値「1.30×10-4S/cm」が配置される。
【0160】
このような合成フローは、「Li2CO3」、「MgO」、「TiO2」および「NH4H2PO4」の出発材料に対して、「mix」および「heat」などの各処理を行うことによって、「Li1.1Mg0.6Ti1.9(PO4)3」の目的材料を合成する処理手順を示す。また、その合成フローは、「mix」の処理が温度773Kで20時間行われることを示す。さらに、その合成フローは、「Li1.1Mg0.6Ti1.9(PO4)3」の目的材料の特性値が「1.30×10-4S/cm」であることを示す。
【0161】
図11は、生成部107によって生成されて合成プロセス蓄積部201に蓄積される合成プロセスの一例を示す図である。
【0162】
生成部107は、
図8に示す合成プロセスを合成プロセス蓄積部201に格納するときには、その合成プロセスに対応するドキュメントの書誌情報を、その合成プロセスに付加する。つまり、生成部107は、生成された複数の合成プロセスのそれぞれに対して、当該合成プロセスに対応するドキュメントの書誌情報を付加する。つまり、生成部107は、上述の(a-5)では、さらに、生成されたプロセス情報iに対して、ドキュメントiの書誌情報を付加する。書誌情報は、例えば、掲載雑誌名、掲載日付および著者名などを含む。また、書誌情報は、そのドキュメントのタイトル、または、著者が属する組織名を含んでいてもよい。また、そのドキュメントが論文である場合、書誌情報は、その論文に割り付けられた論文IDを含んでいてもよく、その論文の被引用数を含んでいてもよい。つまり、書誌情報は、当該書誌情報に対応するドキュメントの著者名、掲載日付、著者が属する組織名、および被引用数のうちの少なくとも1つを示していてもよい。
【0163】
このように書誌情報が付加された合成プロセスが、合成プロセス蓄積部201に蓄積される。なお、
図11では、合成プロセスを分かり易くするために、合成プロセスが合成フローの形態で示されているが、その合成プロセスは、合成フローの形態ではなく、
図8に示す構造化データとして蓄積されてもよい。
【0164】
このように、本実施の形態における合成プロセス生成装置100は、複数の出発材料から目的材料を合成する処理手順である合成プロセスをドキュメントから容易に生成することができる。例えば、ドキュメントに自然言語で記述されている合成プロセスから、グラフ化可能な構造化データである合成プロセスを、容易に生成することができる。これにより、ドキュメントに記述されている合成プロセスをユーザに分かり易く提示することができる。
【0165】
[合成プロセスの分析]
図12は、表示部205に表示される合成プロセス検索画面の一例を示す図である。
【0166】
検索部203は、例えば、操作デバイス340から出力されるユーザの操作結果を示す信号に応じで、
図12に示す合成プロセス検索画面2aを表示部205に表示させる。
【0167】
合成プロセス検索画面2aは、検索条件ウィンドウ2bと、検索開始ボタン2eとを含む。検索条件ウィンドウ2bは、出発材料の名称(すなわち材料単語)を入力するための複数の入力欄と、処理の名称(すなわち処理単語)を入力するための複数の入力欄とを含む。また、検索条件ウィンドウ2bは、出発材料の入力欄を追加するための材料追加ボタン2cと、処理の入力欄を追加するための処理追加ボタン2dとを含む。さらに、検索条件ウィンドウ2bは、目的材料の名称(すなわち材料単語)を入力するための入力欄と、掲載期間を入力するための入力欄と、被引用数を入力するための入力欄とを含む。
【0168】
このような合成プロセス検索画面2aが表示されている場合、ユーザは、操作デバイス340を操作することにより、各入力欄に対する入力処理を行う。例えば、
図12に示すように、ユーザは、出発材料の4つの入力欄に材料単語「Li
2CO
3」、「MgO」、「TiO
2」および「NH
4H
2PO
4」をそれぞれ入力する。なお、その入力欄が足りない場合には、ユーザは、操作デバイス340を操作することにより、材料追加ボタン2cを選択する。これにより、出発材料の名称を入力するための入力欄が追加されて表示される。同様に、ユーザは、処理の6つの入力欄に処理単語「mix」、「heat」、「mill」、「dry」、「press」および「sinter」をそれぞれ入力する。なお、その入力欄が足りない場合には、ユーザは、操作デバイス340を操作することにより、処理追加ボタン2dを選択する。これにより、処理の名称を入力するための入力欄が追加されて表示される。
【0169】
さらに、ユーザは、目的材料の入力欄に材料単語「Li1.1Mg0.6Ti1.9(PO4)3」を入力し、掲載期間の入力欄に「2010/1/1」~「2019/12/31」を入力し、被引用数の入力欄に「10」以上を入力する。
【0170】
そして、ユーザは、操作デバイス340を操作することにより、検索開始ボタン2eを選択する。これにより、検索条件入力部202は、検索条件ウィンドウ2bに入力された出発材料の名称、処理の名称、目的材料の名称、掲載期間、および被引用数を、検索条件として受け付ける。そして、検索条件入力部202は、その検索条件を検索部203に出力する。検索部203は、検索条件入力部202からその検索条件を取得すると、その検索条件に合致する合成プロセスを、合成プロセス蓄積部201に蓄積されている複数の合成プロセスの中から検索する。なお、検索条件には、合成条件および特性値が含まれていてもよい。
【0171】
このように検索部203は、材料単語、処理単語、合成条件、および特性値のうちの少なくとも1つを用いてn個の合成プロセスを検索する。つまり、検索部203は、複数の材料単語、処理単語i、合成条件i、および特性値iのうちの少なくとも1つを用いてプロセス情報1~プロセス情報nを検索する。これにより、材料単語、処理単語、合成条件、および特性値のうちの少なくとも1つが共通しているn個の合成プロセスを検索して複合することができる。また、検索部203は、書誌情報をさらに用いてn個の合成プロセスを検索する。つまり、検索部203は、書誌情報をさらに用いてプロセス情報1~プロセス情報nを検索する。これにより、書誌情報に含まれる例えば掲載期間などが共通しているn個の合成プロセスを検索して複合することができる。
【0172】
図13は、表示部205に表示される検索結果表示画面の一例を示す図である。
【0173】
検索部203は、合成プロセスの検索が終了すると、
図13に示す検索結果表示画面3aを表示部205に表示させる。
【0174】
検索結果表示画面3aは、検索結果ウィンドウ3bと、第1表示ボタン3cと、第2表示ボタン3dとを含む。検索結果ウィンドウ3bには、検索部203によって検索された合成プロセスの一覧が表示される。例えば、ファイル名または論文ID「0001」のドキュメントから生成された名称「P0001」の合成プロセスが、その検索結果ウィンドウ3bに表示される。第1表示ボタン3cは、合成プロセスを合成フローとして表示するためのボタンであり、第2表示ボタン3dは、複合合成プロセスを複合合成フローとして表示するためのボタンである。なお、複合合成フローは、複合合成プロセスがグラフ化されたフローである。
【0175】
例えば、ユーザは、操作デバイス340を操作することによって、検索結果ウィンドウ3bに表示されている名称「P0001」の合成プロセスを選択する。そして、ユーザは、操作デバイス340を操作することによって、第1表示ボタン3cを選択する。その結果、検索部203は、
図9または
図10に示すように、その名称「P0001」の合成プロセスを合成フローとして表示部205に表示させる。
【0176】
また、ユーザは、操作デバイス340を操作することによって、検索結果ウィンドウ3bに表示されている複数の合成プロセスを選択する。例えば、
図13に示すように、名称「P0001」の合成プロセスと、名称「P0029」の合成プロセスと、名称「P0105」の合成プロセスと、名称「P0256」の合成プロセスとが選択される。そして、ユーザは、操作デバイス340を操作することによって、第2表示ボタン3dを選択する。その結果、検索部203は、それら4つの合成プロセスを複合部204に出力する。複合部204は、それら4つの合成プロセスを複合することによって、複合合成プロセスを生成し、その複合合成プロセスを複合合成フローとして表示部205に表示させる。
【0177】
なお、
図13に示す例では、ユーザによって選択された複数の合成プロセスから複合合成プロセスが生成されるが、検索によって見つかった複数の合成プロセスから自動的に複合合成プロセスが生成されて表示されてもよい。つまり、複合部204は、検索結果ウィンドウ3bに示される全ての合成プロセスを複合することによって複合合成プロセスを生成してもよい。
【0178】
また、複合部204は、ユーザによって選択された合成プロセスが1つの場合、または、検索によって見つかった合成プロセスが1つの場合には、複合合成プロセスを生成しない。つまり、複合部204は、検索部203によってn個の合成プロセスが検索された場合、n個が2個以上の場合に、n個の合成プロセスを複合する。
【0179】
図14A~
図14Dのそれぞれは、複合される合成プロセスの一例を示す図である。具体的には、
図14Aは、論文ID「0001」の論文であるドキュメントから生成された合成プロセスを合成フローとして示す図である。
図14Bは、論文ID「0029」の論文であるドキュメントから生成された合成プロセスを合成フローとして示す図である。
図14Cは、論文ID「0105」の論文であるドキュメントから生成された合成プロセスを合成フローとして示す図である。
図14Dは、論文ID「0256」の論文であるドキュメントから生成された合成プロセスを合成フローとして示す図である。
【0180】
これらの4つの合成プロセスは、共通する部分と、複数の異なる部分とを有する。なお、
図14A~
図14Dでは、複数の異なる部分が太線枠で示されている。
【0181】
共通する部分は、検索条件に相当する部分である。つまり、出発材料の材料単語「Li2CO3」、「MgO」、「TiO2」および「NH4H2PO4」と、処理単語「mix」、「heat」、「mill」、「dry」、「press」および「sinter」と、目的材料の材料単語「Li1.1Mg0.6Ti1.9(PO4)3」とは、4つの合成プロセスで共通している。言い換えれば、複数の出発材料の材料単語と、複数の処理単語と、目的材料の材料単語とは、4つの合成プロセスで同一である。一方、これらの4つの合成プロセスでは互いに、合成条件と、目的材料の特性値とが異なっている。例えば、処理単語「heat」の処理に関連付けられている時間の合成条件は、「5h」、「7h」および「4h」のように、4つの合成プロセスで互いに異なっている。同様に、処理単語「heat」の処理に関連付けられている温度の合成条件も、「1223K」、「1200K」、「1800K」および「900K」のように、4つの合成プロセスで互いに異なっている。さらに、処理単語「press」の処理に関連付けられている圧力の合成条件も、「300MPa」、「250MPa」、および「320MPa」のように、4つの合成プロセスで互いに異なっている。そして、目的材料の特性値も、「1.30×10-4S/cm」、「1.32×10-4S/cm」、「1.31×10-4S/cm」および「1.35×10-4S/cm」のように、4つの合成プロセスで互いに異なっている。
【0182】
複合部204は、これら4つの合成プロセスを複合することによって、4つの合成プロセスで共通する部分を示し、かつ、4つの合成プロセスで互いに異なる複数の部分を包括して示す複合合成プロセスを生成する。
【0183】
図15は、複合部204の処理を説明するための図である。
【0184】
複合部204は、上述の4つの合成プロセスのそれぞれで互いに異なる部分をマージする。例えば、複合部204は、4つの合成プロセスのそれぞれで共通の処理単語「heat」に関連付けられている時間の合成条件「5h」、「7h」および「4h」をマージすることによって、時間の包括合成条件「4-7h」を生成する。同様に、複合部204は、4つの合成プロセスのそれぞれで共通の処理単語「heat」に関連付けられている温度の合成条件をマージすることによって、温度の包括合成条件「900-1800K」を生成する。さらに、複合部204は、4つの合成プロセスのそれぞれで共通の処理単語「press」に関連付けられている圧力の合成条件をマージすることによって、圧力の包括合成条件「250-320MPa」を生成する。さらに、複合部204は、4つの合成プロセスのそれぞれの特性値をマージすることによって、包括特性値「1.30×10-4-1.35×10-4S/cm」を生成する。
【0185】
このように、本実施の形態では、互いに異なる複数の合成条件が互いに異なる複数の数値をそれぞれ示す場合、複合部204は、その互いに異なる複数の数値のうちの最小値と最大値とによって示される数値範囲を包括合成条件として生成する。つまり、本実施の形態では、互いに異なる合成条件1~合成条件nが、互いに異なる数値1~数値nをそれぞれ示す場合、複合部204は、包括合成条件の生成では、その互いに異なる数値1~数値nのうちの最小値と最大値とによって示される数値範囲を包括合成条件として生成する。言い換えれば、処理単語1~処理単語nのうち複数の処理単語が同じ処理単語である場合、複合部204は合成条件1~合成条件nからその複数の処理単語に対応する複数の合成条件を含む包括合成条件を生成し、その複数の合成条件を包括合成条件に置き換えて、複合プロセス情報を生成する。そして、以下の場合に、その包括合成条件は、数値pから数値qであることを示す。その場合は、互いに異なる合成条件1~合成条件nが、数値1~数値nをそれぞれ示し、その数値1~数値nのうち、最小の数値が数値pであり、最大の数値が数値qであり、その数値pおよび数値qが1≦p≦n、1≦q≦n、およびp≠qを満たす場合である。
【0186】
また、本実施の形態では、4つの合成プロセスで共通の処理単語に関連付けられている互いに異なる複数の合成条件が、上述の互いに異なる複数の部分に含まれている場合、複合部204は、その互いに異なる複数の合成条件を包括して示す包括合成条件を生成する。そして、複合部204は、その4つの合成プロセスのうちの何れか1つの置換対象合成プロセスに含まれ、共通の処理単語に関連付けられている合成条件を、包括合成条件に置き換えることによって、複合合成プロセスを生成する。つまり、本実施の形態では、複数のプロセス情報で共通の処理単語iに関連付けられている互いに異なる合成条件1~合成条件nが、上述の異なる複数の部分である場合、複合部204は、その互いに異なる合成条件1~合成条件nを含む包括合成条件を生成する。そして、複合部204は、プロセス情報iに含まれ、共通の処理単語iに関連付けられている合成条件iを、その包括合成条件に置き換えることによって、複合プロセス情報を生成する。
【0187】
また、本実施の形態では、4つの合成プロセスで共通の目的材料の材料単語が、上述の共通する部分に含まれ、かつ、4つの合成プロセスで互いに異なる複数の特性値が、上述の互いに異なる複数の部分に含まれている場合、複合部204は、さらに、その互いに異なる複数の特性値を包括して示す包括特性値を生成する。そして、複合部204は、上述の置換対象合成プロセスに含まれる特性値をその包括特性値に置き換える。つまり、本実施の形態では、複数のプロセス情報で共通の目的材料単語が、上述の共通する部分に含まれ、かつ、その複数のプロセス情報で互いに異なる特性値1~特性値nが、上述の異なる複数の部分に含まれている場合、複合部204は、さらに、その互いに異なる特性値1~特性値nを含む包括特性値を生成し、プロセス情報iに含まれる特性値iをその包括特性値に置き換える。
【0188】
例えば、複合部204は、論文ID「0001」の合成プロセスを置換対象合成プロセスとして選択し、その置換対象合成プロセスに含まれる合成条件を包括合成条件に置き換え、その置換対象合成プロセスに含まれる特性値を包括特性値に置き換える。これにより、4つの合成プロセスで共通する部分を示し、かつ、4つの合成プロセスで互いに異なる複数の部分を包括して示す複合合成プロセスが生成される。
【0189】
図16は、表示部205に表示される複合画面の一例を示す図である。
【0190】
複合部204は、上述のように複合合成プロセスを生成すると、例えば
図16に示す複合画面21を表示部205に表示させる。
【0191】
複合画面21には、複合部204によって生成された複合合成プロセスがグラフ化されて表示される。つまり、複合合成フローが表示される。例えば、
図16に示す複合合成フローでは、論文ID「0001」の合成プロセスに含まれる合成条件「5h」、「1223K」および「300MPa」が、包括合成条件「4-7h」、「900-1800K」および「250-320MPa」にそれぞれ置き換えられている。さらに、
図16に示す複合合成フローでは、論文ID「0001」の合成プロセスに含まれる特性値「1.30×10
-4S/cm」が、包括特性値「1.30×10
-4-1.35×10
-4S/cm」に置き換えられている。
【0192】
また、
図16に示す複合合成フローでは、包括合成条件および包括特性値は、他の合成条件、処理単語、および材料単語とは異なる態様で表示されている。例えば、包括合成条件および包括特性値のそれぞれを囲う枠の色、太さ、サイズまたは形状を、他の合成条件などを囲う枠と異ならせてもよい。あるいは、包括合成条件および包括特性値のそれぞれ表示領域の色、サイズまたは形状を、他の合成条件などの表示領域と異ならせてもよい。これにより、包括合成条件および包括特性値を他の合成条件などと区別してユーザに分かり易く提示することができる。
【0193】
このように、本実施の形態では、各ドキュメントで用いられている合成条件が纏めて包括合成条件として表示されるため、その包括合成条件を見れば、新たな材料の合成プロセスを容易に探索することができる。また、本実施の形態では、各ドキュメントで用いられている合成条件が異なることによって目的材料の特性値が異なっていても、それらの特性値が纏めて包括特性値として表示されるため、その包括特性値を見れば、新たな材料の合成プロセスを容易に探索することができる。
【0194】
[処理動作]
図17Aは、本実施の形態における合成プロセス生成装置100の処理動作の一例を示すフローチャートである。
【0195】
まず、ドキュメント選択部101は、ドキュメント蓄積部102に蓄積されている複数のドキュメントから1つのドキュメントを抽出対象ドキュメントとして選択する(ステップS11)。
【0196】
次に、材料単語抽出部103は、
図3Aの(a)に示す材料単語辞書を用いて、抽出対象ドキュメントから材料単語を抽出する(ステップS12)。処理単語抽出部104は、
図3Aの(b)に示す処理単語辞書を用いて、抽出対象ドキュメントから処理単語を抽出する(ステップS13)。条件抽出部105は、
図3Bの(a)に示す条件単語辞書を用いて、抽出対象ドキュメントから合成条件を抽出する(ステップS14)。特性値抽出部106は、
図3Bの(b)に示す特性値辞書を用いて、抽出対象ドキュメントから目的材料の特性値を抽出する(ステップS15)。なお、ステップS12~S15の各処理は、どのような順に行われてもよく、並列に実行されてもよい。
【0197】
次に、生成部107は、抽出された材料単語、処理単語、合成条件および特性値を互いに関連付けることによって合成プロセスを生成する(ステップS16)。さらに、生成部107は、その生成された合成プロセスを合成プロセス蓄積部201に格納する(ステップS17)。
【0198】
次に、ドキュメント選択部101は、ドキュメント蓄積部102に蓄積されている全てのドキュメントが抽出対象ドキュメントとして選択されたか否かを判定する(ステップS18)。ここで、全てのドキュメントが選択されていなと判定すると(ステップS18のNo)、ドキュメント選択部101は、ステップS11の処理を繰り返し実行する。つまり、ドキュメント選択部101は、ドキュメント蓄積部102に蓄積されている複数のドキュメントのうち、未だ選択されていないドキュメントを抽出対象ドキュメントとして選択する。一方、全てのドキュメントが選択されたとドキュメント選択部101によって判定されると(ステップS18のNo)、合成プロセス生成装置100は、合成プロセスの生成処理を終了する。
【0199】
図17Bは、本実施の形態における合成プロセス分析装置200の処理動作の一例を示すフローチャートである。
【0200】
まず、検索条件入力部202は、操作デバイス340から出力されるユーザの操作結果を示す信号に応じた検索条件を受け付ける(ステップS21)。そして、検索部203は、合成プロセス蓄積部201に蓄積されている複数の合成プロセスの中から、その検索条件に合致する合成プロセスを検索する(ステップS22)。そして、検索部203は、ステップS22の検索によって、検索条件に合致する合成プロセスが見つかったか否かを判定する(ステップS23)。ここで、検索条件に合致する合成プロセスが見つからなかったと検索部203によって判定されると(ステップS23のNo)、合成プロセス分析装置200は、合成プロセスの分析処理を終了する。一方、検索部203は、検索条件に合致する合成プロセスが見つかった判定すると(ステップS23のYes)、さらに、その見つかった合成プロセスが複数あるか否かを判定する(ステップS24)。ここで、検索部203は、その見つかった合成プロセスが複数ではなく1つであると判定すると(ステップS24のNo)、ユーザによる操作に応じて、その合成プロセスを合成フローとして表示部205に表示させる(ステップS27)。一方、その見つかった合成プロセスが複数あると検索部203によって判定されると(ステップS24のYes)、複合部204は、ユーザによる操作に応じて、見つかった複数の合成プロセスを複合する(ステップS25)。そして、複合部204は、その複合によって生成された複合合成プロセスを複合合成フローとして表示部205に表示させる(ステップS26)。
【0201】
以上のように、本実施の形態では、複数の出発材料から目的材料を合成する処理手順である合成プロセスをドキュメントから容易に生成することができる。また、生成された複数の合成プロセスから複合合成プロセスが生成されるため、多くの合成プロセスの共通部分と、互いに異なる部分とを分かり易く表示することができる。これにより、新たな材料の合成プロセスの探索を適切に支援することができる。また、それぞれ最新のドキュメントから生成された複数の合成プロセスが組み合わされる場合には、材料開発に関する知見を最新に保つことができる。また、膨大な数のドキュメントを利用することによって、広い範囲の材料を網羅した合成プロセスの探索を支援することができる。
【0202】
また、本実施の形態では、生成部107によって生成される複数の合成プロセスと、複合部204によって生成される複合合成プロセスとはそれぞれ、グラフ化可能に構成されている。そして、表示部205は、複合部204によって生成された複合合成プロセスをグラフとして表示する。つまり、本実施の形態では、生成部107によって生成される複数のプロセス情報と、複合部204によって生成される複合プロセス情報とはそれぞれ、グラフ化可能に構成されている。そして、出力部の一例である表示部205は、複合部204によって生成された複合プロセス情報をグラフとして表示する。
【0203】
これにより、複数の合成プロセスがグラフ化可能な構造化データとして構成されているため、複合合成プロセスもグラフ化可能な構造化データとして簡単に生成することができる。さらに、複合合成プロセスが例えばフローのようなグラフとして表示されるため、複合合成プロセスをユーザに適切に把握させることができる。
【0204】
(変形例1)
上記実施の形態1では、複合合成フローでは、出発材料の材料単語、処理単語、および合成条件が同様の態様で示されている。本変形例では、出発材料の材料単語、処理単語、および合成条件は、それぞれ異なる態様で示される。
【0205】
図18は、本変形例に係る表示部205に表示される複合画面の一例を示す図である。
【0206】
本変形例に係る複合部204は、上述のように複合合成プロセスを生成すると、例えば
図16に示す複合画面21の代わりに、
図18に示す複合画面22を表示部205に表示させる。
【0207】
この複合画面22には、複合部204によって生成された複合合成プロセスが複合合成フローとして表示される。本変形例に係る複合合成フローでは、出発材料の材料単語と、目的材料の材料単語と、処理単語と、合成条件と、特性値とは、それぞれ異なる態様で表示される。例えば、
図18に示すように、出発材料の材料単語は、実線枠で囲われ、処理単語は、実線と破線の二重枠で囲われ、合成条件は、破線枠で囲われ、目的材料の材料単語は、太い実線枠で囲われ、特性値は、実線の二重枠で囲われる。このように、出発材料の材料単語と、目的材料の材料単語と、処理単語と、合成条件と、特性値とを、互いに異なる枠でそれぞれ囲ってもよい。または、出発材料の材料単語と、目的材料の材料単語と、処理単語と、合成条件と、特性値とのそれぞれの表示領域の色、サイズまたは形状を互いに異ならせてもよい。
【0208】
これにより、出発材料の材料単語と、目的材料の材料単語と、処理単語と、合成条件と、特性値とをそれぞれ区別してユーザに分かり易く提示することができる。
【0209】
(変形例2)
上記実施の形態1では、互いに異なる複数の合成条件を全て包括することによって包括合成条件が生成される。本変形例では、これらの複数の合成条件を全て包括することなく、クラスタリングにより部分ごとに包括する。
【0210】
図19は、本変形例に係る複合部204の処理を説明するための図である。
【0211】
本変形例に係る複合部204は、互いに異なる複数の合成条件が互いに異なる複数の数値をそれぞれ示す場合、その互いに異なる複数の数値を含む集合に対してクラスタリングを行うことによって、複数の部分集合を生成し、その複数の部分集合のそれぞれから包括合成条件を生成する。つまり、本変形例では、互いに異なる合成条件1~合成条件nが、互いに異なる数値1~数値nをそれぞれ示す場合、複合部204は、その互いに異なる数値1~数値nを含む集合に対してクラスタリングを行うことによって、複数の部分集合を生成し、その複数の部分集合のそれぞれから包括合成条件を生成する。
【0212】
例えば、
図19に示すように、検索部203によって6つの合成プロセスが検索される。ここで、処理単語「press」に関連付けられている圧力の合成条件は、「300MPa」、「250MPa」、「320MPa」、「450MPa」および「460MPa」のように、6つの合成プロセスで互いに異なっている。このとき、複合部204は、その互いに異なる圧力の数値を含む集合に対してクラスタリングを行うことによって、2つの部分集合を生成する。クラスタリングには、既存の手法(例えばk-means法)が用いられる。その結果、「300MPa」、「250MPa」および「320MPa」を含む第1部分集合と、「450MPa」および「460MPa」を含む第2部分集合とが生成される。なお、
図19では、第1部分集合は、一点鎖線の枠で示され、第2部分集合は、破線枠で示される。複合部204は、第1部分集合から圧力の包括合成条件「250-320MPa」を生成し、第2部分集合から圧力の包括合成条件「450-460MPa」を生成する。
【0213】
また、複合部204は、第1部分集合に対応する複数の特性値から包括特性値「1.30×10-4-1.35×10-4S/cm」を生成し、第2部分集合に対応する複数の特性値から包括特性値「1.41×10-4-1.42×10-4S/cm」を生成する。
【0214】
そして、複合部204は、例えば論文ID「0001」の合成プロセスを置換対象合成プロセスとして選択し、その置換対象合成プロセスに含まれる合成条件を2つの包括合成条件に置き換え、その置換対象合成プロセスに含まれる特性値を2つの包括特性値に置き換える。これにより、6つの合成プロセスで共通する部分を示し、かつ、6つの合成プロセスで互いに異なる複数の部分を包括して示す複合合成プロセスが生成される。
【0215】
図20Aは、本変形例に係る表示部205に表示される複合画面の一例を示す図である。
【0216】
複合部204は、上述のように複合合成プロセスを生成すると、例えば
図20Aに示す複合画面23aを表示部205に表示させる。複合画面23aには、複合部204によって生成された複合合成プロセスが複合合成フローとして表示される。
【0217】
例えば、
図20Aに示す複合合成フローでは、論文ID「0001」の合成プロセスに含まれる圧力の合成条件「300MPa」が、包括合成条件「250-320MPa」および「450-460MPa」に置き換えられている。さらに、
図20Aに示す複合合成フローでは、論文ID「0001」の合成プロセスに含まれる特性値「1.30×10
-4S/cm」が、包括特性値「1.30×10
-4-1.35×10
-4S/cm」および「1.41×10
-4-1.42×10
-4S/cm」に置き換えられている。
【0218】
例えば、互いに異なる複数の合成条件の分散が小さい場合には、上記実施の形態1のように、それらの全ての合成条件を包括することによって包括合成条件を生成すればよい。しかし、その分散が大きい場合には、本変形例のようにクラスタリングを行うことによって、複数の包括合成条件を生成すれば、未だ用いられていない合成条件を見つけ易くすることができる。
【0219】
図20Bは、本変形例に係る表示部205に表示される複合画面の他の例を示す図である。
【0220】
複合部204は、上述のように複合合成プロセスを生成すると、例えば
図20Bに示す複合画面23bを表示部205に表示させてもよい。複合画面23bには、複合部204によって生成された複合合成プロセスが複合合成フローとして表示される。
【0221】
例えば、
図20Bに示す複合合成フローは、処理単語「dry」から2つに分岐している。つまり、処理単語「dry」の処理に、2つの分岐フローが接続されている。2つの分岐フローはそれぞれ、処理単語「press」および「sinter」と、目的材料の材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」とを含む。また、2つの分岐フローのうちの第1分岐フローに含まれる処理単語「press」の処理には、包括合成条件「250-320MPa」が関連付けられ、第2分岐フローに含まれる処理単語「press」の処理には、包括合成条件「450-460MPa」が関連付けられている。さらに、第1分岐フローに含まれる目的材料の材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」には、包括特性値「1.30×10
-4-1.35×10
-4S/cm」が関連付けられている。第2分岐フローに含まれる目的材料の材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」には、包括特性値「1.41×10
-4-1.42×10
-4S/cm」が関連付けられている。
【0222】
これにより、検索された複数のドキュメントには、2種類のタイプの合成プロセスがあることが確認でき、それぞれの合成プロセスに対する目的材料の特性値を確認することが可能になる。
【0223】
このように本変形例では、クラスタリングによって生成された複数の包括合成条件が生成されるため、各ドキュメントで用いられている合成条件の傾向をより詳細に把握することができる。
【0224】
(変形例3)
上記実施の形態1では、全ての処理単語が共通の合成プロセスを複合することによって複合合成プロセスを生成する。本変形例では、互いに異なる処理単語を有する合成プロセスを複合することによって複合合成プロセスを生成する。
【0225】
図21Aおよび
図21Bのそれぞれは、本変形例において複合される合成プロセスの一例を示す図である。例えば、表示部205によって、
図12に示す合成プロセス検索画面2aが表示されているときに、ユーザは、処理の入力欄には処理の名称(すなわち処理単語)を入力することなく、検索開始ボタン2eを選択する。つまり、出発材料の材料単語「Li
2CO
3」、「MgO」、「TiO
2」および「NH
4H
2PO
4」と、目的材料の材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」と、掲載期間「2010/1/1」~「2019/12/31」と、被引用数「10」以上とが、検索条件として用いられて、合成プロセスの検索が開始される。
【0226】
この検索によって、例えば、
図21Aに示す論文ID「0001」の合成プロセスと、
図21Bに示す論文ID「0142」の合成プロセスとが見つけ出される。
【0227】
これらの合成プロセスでは互いに、出発材料と目的材料とが一致している。しかし、処理は互いに異なっている。つまり、論文ID「0001」の合成プロセスは、処理単語「mix」、「heat」、「mill」、「dry」、「press」および「sinter」を含んでいるが、論文ID「0142」の合成プロセスは、処理単語「mix」、「heat」、「mill」および「heat」を含んでいる。言い換えれば、論文ID「0001」の合成プロセスと、論文ID「0142」の合成プロセスとは、互いに共通の処理単語「mix」、「heat」および「mill」を含んでいるが、互いに異なる処理単語も含んでいる。論文ID「0001」の合成プロセスに含まれる処理単語「dry」、「press」および「sinter」と、論文ID「0142」の合成プロセスに含まれる処理単語「heat」とが、異なっている。
【0228】
また、論文ID「0001」の合成プロセスと、論文ID「0142」の合成プロセスとは、共通の処理単語「heat」を含む。しかし、これらの2つの合成プロセスでは、この共通の処理単語「heat」に関連付けられている合成条件が異なっている。つまり、論文ID「0001」の合成プロセスでは、その合成条件は「5h」および「1223K」であって、論文ID「0142」の合成プロセスでは、その合成条件は「7h」および「1200K」である。そこで、複合部204は、これらの互いに異なる合成条件をマージする。
【0229】
図22は、複合部204の処理を説明するための図である。
【0230】
複合部204は、上述の2つの合成プロセスのそれぞれで互いに異なる合成条件をマージする。例えば、複合部204は、2つの合成プロセスのそれぞれで共通の処理単語「heat」に関連付けられている時間の合成条件「5h」および「7h」をマージすることによって、時間の包括合成条件「5-7h」を生成する。同様に、複合部204は、その共通の処理単語「heat」に関連付けられている温度の合成条件をマージすることによって、温度の包括合成条件「1200-1223K」を生成する。
【0231】
本変形例に係る複合部204は、上述の各包括合成条件を含み、かつ、互いに異なる処理単語を含む複合合成プロセスを生成する。
【0232】
図23は、本変形例に係る表示部205に表示される複合画面の一例を示す図である。
【0233】
複合部204は、上述のように複合合成プロセスを生成すると、例えば
図23に示す複合画面24を表示部205に表示させる。複合画面24には、複合部204によって生成された複合合成プロセスが複合合成フローとして表示される。
【0234】
例えば、
図23に示す複合合成フローでは、論文ID「0001」の合成プロセスに含まれる合成条件「5h」および「1223K」が、包括合成条件「5-7h」および「1200-1223K」にそれぞれ置き換えられている。
【0235】
さらに、
図23に示す複合合成フローでは、論文ID「0001」の合成プロセスに対して、論文ID「0142」の合成プロセスの一部が追加されている。具体的には、
図23に示す複合合成フローは、上述の2つの合成プロセスで共通の処理単語「mill」から2つに分岐している。つまり、処理単語「mill」の後に、論文ID「0142」の合成プロセスの一部である分岐フローが接続されている。この分岐フローは、処理単語「heat」の処理を経て目的材料が生成されるフローである。
【0236】
このように本変形例では、複合部204は、処理の流れが、2つの合成プロセスで共通の部分から互いに異なる複数の部分へそれぞれ分岐するように、その互いに異なる複数の部分のそれぞれを包括的にその共通の部分に関連付けることによって、複合合成プロセスを生成する。つまり、本変形例では、(a-2)では、処理単語抽出部104は、ドキュメントiから上述の処理単語iを含む少なくとも1つの処理単語iを抽出し、(a-3)では、条件抽出部105が、ドキュメントiから上述の合成条件iを含む少なくとも1つの合成条件iを抽出する。そして、複合部204は、材料の生成の流れが上述の共通の部分から上述の異なる複数の部分へそれぞれ分岐するように、その異なる複数の部分のそれぞれを共通の部分に関連付けることによって、複合プロセス情報を生成する。
【0237】
これにより、本変形例では、例えば複数の合成プロセスにおいて、共通の処理単語と、互いに異なる複数の処理単語とが含まれている場合には、材料の生成の流れが共通の処理単語の処理から互いに異なる複数の処理単語の処理へそれぞれ分岐するように、複合合成プロセスが生成される。これにより、複数の合成プロセスにおいて互いに異なる複数の処理単語が含まれていても、共通の処理と、互いに異なる複数の処理とを分かり易く表示することができる。また、互いに異なる複数の処理を比較し易く表示することができる。
【0238】
なお、
図21A~
図23に示す例では、複合合成プロセス情報の生成に用いられる複数の合成プロセス情報のそれぞれは、複数の処理単語および複数の合成条件を含んでいる。しかし、複数の合成プロセス情報のそれぞれは、1つの処理単語および1つの合成条件を含んでいてもよい。つまり、複数の合成プロセス情報のそれぞれは、1つのドキュメントから1つの処理単語および1つの合成条件が抽出されて生成されていてもよい。
【0239】
例えば、
図21Aのように、論文ID「0001」のドキュメントからは、複数の出発材料単語と、複数の処理単語と、複数の合成条件と、目的材料単語と、特性値とが抽出され、それらを用いて合成プロセス情報が生成されている。しかし、例えば、複数の処理単語および複数の合成条件ではく、例えば1つの処理単語「dry」と、その「dry」に対応する1つの合成条件「393K」が抽出されてもよい。
【0240】
同様に、
図21Bのように、論文ID「0142」のドキュメントからは、複数の出発材料単語と、複数の処理単語と、複数の合成条件と、目的材料単語と、特性値とが抽出され、それらを用いて合成プロセス情報が生成されている。しかし、例えば、複数の処理単語および複数の合成条件ではく、1つの処理単語「heat」と、その「heat」に対応する1つの合成条件「450K」が抽出されてもよい。
【0241】
このような場合、論文ID「0001」の合成プロセス情報と、論文ID「0142」の合成プロセス情報とでは、複数の出発材料単語は共通する。一方、これらの合成プロセス情報の間では、処理単語「dry」および合成条件「393K」と、処理単語「heat」および合成条件「450K」とは、互いに異なっている。したがって、これらの合成プロセス情報から生成される複合プロセス情報では、共通の部分(すなわち複数の出発材料単語)から、処理単語「dry」および合成条件「393K」に分岐する流れと、処理単語「heat」および合成条件「450K」に分岐する流れとが、存在する。つまり、複数のドキュメントのそれぞれから1つの処理単語と1つの合成条件とが抽出される場合であっても、共通の部分から上述の異なる複数の部分へそれぞれ分岐するように、その異なる複数の部分のそれぞれを共通の部分に関連付けることによって、複合プロセス情報を生成することができる。
【0242】
(変形例4)
上記実施の形態1では、著者が属する組織名、すなわち機関を用いた合成プロセスの検索は行われていない。本変形例では、その組織名または機関を用いた合成プロセスの検索が行われる。
【0243】
図24は、本変形例に係る表示部205によって表示される合成プロセス検索画面の一例を示す図である。
【0244】
本変形例に係る検索部203は、例えば、操作デバイス340から出力されるユーザの操作結果を示す信号に応じで、
図24に示す合成プロセス検索画面2fを表示部205に表示させる。
【0245】
合成プロセス検索画面2fは、上記実施の形態1における合成プロセス検索画面2aと比べて、検索条件として機関名をさらに含む点が異なる。つまり、合成プロセス検索画面2fは、検索条件ウィンドウ2gを含み、その検索条件ウィンドウ2gは、機関名を入力するための入力欄を含む。機関名は、合成プロセスの生成に用いられたドキュメントを発行または掲載した著者が所属する機関の名称(すなわち組織名)である。なお、本変形例では、合成プロセス蓄積部201に蓄積されている各合成プロセスに付加されている書誌情報には、その機関名が含まれている。
【0246】
このような合成プロセス検索画面2fが表示されている場合、ユーザは、操作デバイス340を操作することにより、各入力欄に対する入力処理を行う。例えば、
図24に示すように、ユーザは、機関名の入力欄に「A大学」を入力する。さらに、ユーザは、出発材料の4つの入力欄に材料単語「Li
2CO
3」、「MgO」、「TiO
2」および「NH
4H
2PO
4」をそれぞれ入力する。さらに、ユーザは、目的材料の入力欄に材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」を入力し、掲載期間の入力欄に「2010/1/1」~「2019/12/31」を入力し、被引用数の入力欄に「10」以上を入力する。
【0247】
そして、ユーザは、操作デバイス340を操作することにより、検索開始ボタン2eを選択する。これにより、検索条件入力部202は、検索条件ウィンドウ2gに入力された機関名、出発材料の名称、目的材料の名称、掲載期間、および被引用数を、検索条件として受け付ける。そして、検索条件入力部202は、その検索条件を検索部203に出力する。検索部203は、検索条件入力部202からその検索条件を取得すると、その検索条件に合致する合成プロセスを、合成プロセス蓄積部201に蓄積されている複数の合成プロセスの中から検索する。
【0248】
複合部204は、このような検索によって、複数の合成プロセスを見つけ出すと、それらの合成プロセスを上記実施の形態1またはその変形例と同様に複合することによって、複合合成プロセスを生成する。このように生成される複合合成プロセスは、A大学用の複合合成プロセスである。
【0249】
ここで、例えば、
図24に示す合成プロセス検索画面2fの機関名の入力欄に、「A社」の代わりに「B社」が入力されると、複合部204は、B社用の複合合成プロセスを生成する。
【0250】
図25Aおよび
図25Bのそれぞれは、本変形例に係る表示部205に表示される複合画面の一例を示す図である。
【0251】
複合部204は、A大学用の複合合成プロセスが生成された場合には、例えば
図25Aに示すA大学用の複合画面21aを表示部205に表示させる。複合画面21aには、複合部204によって生成されたA大学用の複合合成プロセスが複合合成フローとして表示される。一方、複合部204は、B社用の複合合成プロセスが生成された場合には、例えば
図25Bに示すB社用の複合画面21bを表示部205に表示させる。複合画面21bには、複合部204によって生成されたB社用の複合合成プロセスが複合合成フローとして表示される。
【0252】
目的材料の合成プロセスは、実験を行う大学または企業などの機関または組織によって異なり、それらの機関が保有している設備または開発戦略の違いにより、実験を行う傾向も異なる場合がある。そこで、本変形例では、
図25Aおよび
図25Bに示すように、論文などのドキュメントの著者が所属する機関(例えば大学または企業等)ごとに、複合合成プロセスを表示する。これにより、ユーザは、機関ごとの複合合成プロセスを比較して把握することが可能になる。
図25Aに示す例では、A大学用の複合合成プロセスにおいて処理単語「heat」に関連付けられている合成条件は、短時間でかつ低温度である。一方、
図25Bに示す例では、B社用の複合合成プロセスにおける処理単語「heat」に関連付けられている合成条件は、長時間でかつ高温度である。その結果、B社用の複合合成プロセスでの目的材料の特性値は、A大学用の複合合成プロセスでの目的材料の特性値よりも大きい傾向にある。このように、本変形例では、機関ごとの複合合成プロセスを比較することができる。
【0253】
また、本変形例でも、上記実施の形態と同様に、掲載期間を検索条件に用いて複数の合成プロセスが検索されて複合される。したがって、論文などのドキュメントが出版された年代で複合合成プロセスを分類することができ、例えば合成条件が年代によってどのように変化しているかを確認することも可能になる。
【0254】
(変形例5)
本変形例では、複数の出発材料から中間材料を合成し、さらに、その中間材料から目的材料を合成する手順を示す複合プロセス情報を生成する。
【0255】
図26は、中間材料の合成を含む複合プロセス情報の一例を示す図である。
【0256】
例えば、合成プロセス生成装置100である生成装置は、
図26に示すように、ドキュメントから第1プロセス情報を生成し、他のドキュメントから第2プロセス情報を生成する。第1プロセス情報は、複数の出発材料単語と、処理単語と、合成条件と、目的材料単語とを関連付けて示す。また、第2プロセス情報も、第1プロセス情報と同様に、複数の出発材料単語と、処理単語と、合成条件と、目的材料単語とを関連付けて示す。ここで、第1プロセス情報の目的材料単語と、第2プロセス情報の複数の出発材料単語のうちの1つの出発材料単語とが、同一の単語であって、共通している場合がある。
【0257】
このような場合、本変形例における複合部204は、第1プロセス情報によって示される複数の出発材料から、第2プロセス情報によって示される目的材料を生成する手順を示す複合プロセス情報を生成してもよい。つまり、第1プロセス情報によって示される目的材料は、第2プロセス情報によって示される目的材料を生成するための中間材料として扱われる。
【0258】
このように、本変形例では、複数のプロセス情報のうち、第1プロセス情報の目的材料単語と、第2プロセス情報の出発材料単語とは、同一の材料単語であって、その複数のプロセス情報で共通する部分である。このような場合、複合部204によって生成される複合プロセス情報は、第1プロセス情報によって示される複数の出発材料から、その共通する部分である同一の材料単語によって示される材料を中間材料として合成し、さらに、その中間材料から、第2プロセス情報によって示される目的材料を生成する手順を示す。
【0259】
これにより、何れのドキュメントにも記載されていない手順を示す複合プロセス情報を生成することができる。したがって、このような複合プロセス情報が表示される場合には、新たな合成プロセスの探索をさらに支援することができる。
【0260】
(実施の形態2)
実施の形態2における合成プロセス分析装置は、ユーザから合成条件を受け付け、その受け付けられた合成条件に応じた目的材料の特性値を推定する。
【0261】
図27は、本実施の形態における合成プロセス探索支援システムの機能構成の一例を示すブロック図である。なお、本実施の形態における各構成要素のうち、実施の形態1と同一の構成要素については、実施の形態1と同一の符号を付し、詳細な説明を省略する。
【0262】
本実施の形態における合成プロセス探索支援システム11は、合成プロセス生成装置100と、合成プロセス分析装置240とを備える。
【0263】
合成プロセス生成装置100は、実施の形態1と同様に、合成プロセスを生成する。また、本実施の形態における合成プロセス生成装置100の条件抽出部105および特性値抽出部106は、抽出された合成条件および特性値をそれぞれ合成プロセス分析装置240に出力する。
【0264】
本実施の形態における合成プロセス分析装置240は、実施の形態1の合成プロセス分析装置200の各構成要素を備えるとともに、さらに、関連蓄積部206と、合成条件入力部207と、特性値推定部208とを備える。
【0265】
[関連蓄積部]
関連蓄積部206は、条件抽出部105によって抽出された合成条件と、特性値抽出部106によって抽出された特性値とを互いに関連付けて保持するための記録容量を有する記録媒体である。この関連蓄積部206には、ドキュメント、またはそのドキュメントから生成された合成プロセスごとに、少なくとも1つの合成条件と特性値とが関連付けられている。なお、関連蓄積部206は、例えば、ハードディスク、RAM、ROM、または半導体メモリなどであってもよい。また、関連蓄積部206は、揮発性であっても不揮発性であってもよい。
【0266】
[合成条件入力部]
合成条件入力部207は、操作デバイス340から出力されるユーザの操作結果を示す信号に応じた合成条件を入力合成条件として受け付ける。つまり、合成条件入力部207は、処理の条件である入力合成条件を受け付ける。
【0267】
[特性値推定部]
特性値推定部208は、複合合成プロセスが生成され、さらに、合成条件入力部207によって入力合成条件が受け付けられると、その入力合成条件に応じた目的材料の特性値を推定する。その目的材料は、複合合成プロセスの生成に用いられた複数の合成プロセスにおいて共通の目的材料である。したがって、本実施の形態における特性値推定部208は、その共通の目的材料の入力合成条件に応じた特性値を推定する。つまり、特性値推定部208は、共通の目的材料単語の目的材料が有する入力合成条件に応じた特性値を推定する。
【0268】
具体的には、特性値推定部208は、複合合成プロセスの生成に用いられた複数の合成プロセスのそれぞれについて、その合成プロセスに含まれる合成条件および特性値を関連蓄積部206から取得する。そして、特性値推定部208は、その取得された合成条件および特性値を用いて、合成条件入力部207に受け付けられた入力合成条件に応じた目的材料の特性値を推定する。この特性値の推定には、重回帰分析法などが用いられてもよい。例えば、特性値推定部208は、関連蓄積部206から取得された合成条件および特性値から、入力合成条件に対して特性値を出力する数式を、重回帰分析法にしたがってモデル化する。そして、特性値推定部208は、合成条件入力部207によって受け付けられた入力合成条件を、モデル化された数式に代入することによって特性値を導出する。これにより、特性値が推定される。なお、重回帰分析法の代わりに、連立方程式を用いてもよく、補間処理によって特性値を推定してもよい。なお、補間は内挿補間であってもよく外挿補間であってもよい。
【0269】
このように本実施の形態における特性値推定部208は、複数の合成プロセスのそれぞれに含まれる合成条件と、複数の合成プロセスのそれぞれに含まれる特性値との関係に基づいて、入力合成条件に応じた特性値を推定する。つまり、本実施の形態における特性値推定部208は、複数のプロセス情報のそれぞれに含まれる合成条件iと、複数のプロセス情報のそれぞれに含まれる特性値iとの関係に基づいて、入力合成条件に応じた特性値を推定する。
【0270】
図28は、本実施の形態における表示部205に表示される複合画面の一例を示す図である。
【0271】
本実施の形態における複合部204は、実施の形態1と同様に、
図14A~
図14Dに示す4つの合成プロセスから複合合成プロセスを生成すると、例えば
図28に示す複合画面25を表示部205に表示させる。複合画面25には、複合部204によって生成された複合合成プロセスが複合合成フローとして表示される。
【0272】
本実施の形態における複合合成フローでは、包括合成条件が入力範囲として示されている。また、包括特性値は示されていない。例えば、処理単語「heat」の処理における時間の合成条件の入力範囲として包括合成条件「4-7h」が示され、その処理における温度の合成条件の入力範囲として包括合成条件「900-1800K」が示されている。同様に、処理単語「press」の処理における圧力の合成条件の入力範囲として包括合成条件「250-320K」が示されている。
【0273】
ここで、複合画面25には、入力範囲ごとに、その入力範囲の合成条件を入力するための入力欄25a~25c(
図28中の太実線枠)が設けられている。ユーザは、操作デバイス340を操作することによってそれらの入力欄25a~25cに合成条件を入力する。このようなに入力される合成条件は、合成条件入力部207によって入力合成条件として受け付けられる。そして、全ての入力欄25a~25cへの合成条件の入力が完了すると、特性値推定部208は、各入力欄25a~25cに入力された合成条件に応じた目的材料の特性値を推定する。そして、特性値推定部208は、その推定された特性値を表示部205の複合画面25に表示させる。このように推定された特性値は、複合画面25の目的材料の材料単語「Li
1.1Mg
0.6Ti
1.9(PO
4)
3」の周辺に配置される。なお、
図28の例では、推定された特性値は太破線枠内に配置される。このように、表示部205は、特性値推定部208によって推定された特性値を表示する。なお、本実施の形態における出力部の一例である表示部205は、上述のように特性値を表示するが、その出力部は、特性値推定部208によって推定された特性値を出力してもよい。
【0274】
例えば、処理単語「heat」の処理に対する時間の合成条件「5h」および温度の合成条件「1300K」と、処理単語「press」の処理に対する圧力の合成条件「280MPa」とが、それぞれ入力合成条件として合成条件入力部207に受け付けられる。この場合、特性値推定部208は、目的材料の特性値「1.32×10-4S/cm」を推定して表示部205に表示させる。
【0275】
図29は、複合画面25の入力欄への入力方法を説明するための図である。
【0276】
ユーザは、例えば入力欄25aに時間の合成条件を入力するときには、操作デバイス340を操作することによって任意の合成条件を入力してもよく、複数の候補から何れかの候補を合成条件として選択してもよい。
【0277】
具体的には、複合部204は、包括合成条件を生成すると、その包括合成条件によって示される範囲にある少なくとも1つの数値を合成条件の候補として選択可能な入力欄25aを複合画面25に設ける。例えば、入力欄25aは、プルダウンメニューによって構成されている。時間の包括合成条件が「4-7h」である場合、入力範囲は「4-7h」である。したがって、ユーザによって入力欄25aが選択されると、時間の合成条件の候補として、4h、5h、6hおよび7hが表示される。ユーザは、操作デバイス340を操作することによって何れかの候補を選択する。これにより、その選択された候補が入力欄25aに合成条件として入力される。このように入力された合成条件は、入力合成条件として合成条件入力部207に受け付けられる。
【0278】
このように本実施の形態では、ユーザが入力合成条件を設定すると、目的材料の特性値が推定されて表示されるため、例えば、新たな特性値を有する材料の合成プロセスを容易に探索することができる。したがって、ユーザは、実験をすることなく、任意の合成条件に対する目的材料の特性値を把握することが可能になる。
【0279】
(実施の形態3)
実施の形態3における合成プロセス分析装置は、包括合成条件を実現可能な設備に関する情報を提示する。
【0280】
図30は、本実施の形態における合成プロセス探索支援システムの機能構成の一例を示すブロック図である。なお、本実施の形態における各構成要素のうち、実施の形態1と同一の構成要素については、実施の形態1と同一の符号を付し、詳細な説明を省略する。
【0281】
本実施の形態における合成プロセス探索支援システム12は、合成プロセス生成装置100と、合成プロセス分析装置250とを備える。
【0282】
本実施の形態における合成プロセス分析装置250は、実施の形態1の合成プロセス分析装置200の各構成要素を備えるとともに、さらに、設備特性蓄積部211と、設備検索部212とを備える。
【0283】
[設備特性蓄積部]
設備特性蓄積部211は、設備情報を保持している記録媒体である。設備情報は、複数の設備のそれぞれについて、当該設備で実現可能な処理の条件の一覧を示す。なお、設備特性蓄積部211は、例えば、ハードディスク、RAM、ROM、または半導体メモリなどであってもよい。また、設備特性蓄積部211は、揮発性であっても不揮発性であってもよい。
【0284】
[設備検索部]
設備検索部212は、上述の設備情報を参照することによって、複合部204によって生成された包括合成条件で処理を行うことが可能な設備を検索する。
【0285】
また、本実施の形態における表示部205は、設備検索部212によって検索された設備に関する情報を表示する。なお、本実施の形態における出力部の一例である表示部205は、上述のように設備に関する情報を表示するが、その出力部は、設備検索部212によって検索された設備に関する情報を出力してもよい。
【0286】
図31は、本実施の形態における設備情報の一例を示す図である。
【0287】
設備情報は、例えば
図31に示すように、設備のそれぞれについて、その設備の性能値と価格とを示す。設備は、メーカ名と機種番号とによって識別される。また、性能値は、実現可能な処理の条件である。例えば、その設備情報は、メーカ名「A社」の機種番号「AS-0122」の設備が、加圧処理の実現可能な条件として性能値「260-300MPa」を有し、その設備の価格が「500,000円」であることを示す。
【0288】
図32は、本実施の形態における表示部205に表示される複合画面の一例を示す図である。
【0289】
本実施の形態における複合部204は、実施の形態1と同様に、
図14A~
図14Dに示す4つの合成プロセスから複合合成プロセスを生成すると、例えば
図32に示す複合画面26を表示部205に表示させる。複合画面26には、複合部204によって生成された複合合成プロセスが複合合成フローとして表示される。
【0290】
さらに、本実施の形態では、設備検索部212は、検索された設備に関する情報を、その複合画面26に表示させる。例えば、複合部204によって圧力の包括合成条件「250-320MPa」が生成される。このとき、設備検索部212は、その圧力の包括合成条件「250-320MPa」で加圧処理を行うことが可能な設備を、例えば
図31に示す設備情報を参照することによって検索する。その結果、設備検索部212は、メーカ名「B社」の機種番号「YP-0134」の設備を見つける。そして、設備検索部212は、そのメーカ名「B社」および機種番号「YP-0134」と、設備情報においてその設備に関連付けられている例えば価格「800,000円」とを、その包括合成条件「250-320MPa」に関連付けて表示部205に表示させる。なお、価格は表示されなくてもよい。
【0291】
これにより本実施の形態では、複合合成フローを表示するとともに、その複合合成フローに含まれる包括合成条件で処理を行うことが可能な設備をユーザに容易に知らせることができる。その結果、材料合成に必要とされる設備を容易に手配することができる。
【0292】
つまり、本実施の形態では、複合合成フローに含まれる包括合成条件と目的材料の包括特性値とが表示されたときに、どのような設備を用いてその複合合成フローを検証できるか確認することができる。
【0293】
なお、本実施の形態では、設備に関する情報が複合合成フローと同時に表示されるが、同時に表示されなくてもよい。例えば、表示されている包括合成条件がユーザによって選択されたときに、その包括合成条件に対応する設備に関する情報が表示されてもよい。つまり、設備検索部212は、複合合成フローに含まれる包括合成条件が選択されたことを示す信号を操作デバイス340から受け付けたときに、その包括合成条件で処理を行うことが可能な設備を、設備情報を参照することによって検索する。そして、設備検索部212は、その設備に関する情報を、その包括合成条件に関連付けて表示部205に表示させる。
【0294】
(実施の形態4)
本実施の形態における支援装置は、論文などのドキュメントから情報を抽出して解析することにより、材料または装置を販売する販売会社の営業活動を効率化するシステムである。
【0295】
販売会社における営業活動では、顧客に関する情報を事前に収集し、その材料または装置の購入の見込みの高い顧客を見つけることが契約の成約率を高める上で重要である。
【0296】
しかしながら、販売会社の主な顧客である大学または企業などの組織は、実験に使用している材料または装置の情報を自ら開示することがほとんど無い。したがって、販売会社がその顧客に関する情報を収集することは困難である。
【0297】
また、営業活動を効率的に行うために、顧客に関する情報を継続的に更新する必要があるが、販売会社では人手による営業活動が主であるため、顧客に関する情報の更新にはコストがかかる。
【0298】
そこで、本実施の形態における支援装置は、組織に属する研究者が出版する論文データから抽出された情報を解析することにより、販売会社の営業活動の効率化を図ることができる。
【0299】
[システム概略構成]
図33は、支援装置の概略構成の一例を示す図である。
【0300】
支援装置13は、それぞれ通信ネットワーク150を介して互いに接続されている、第1解析装置110と、第2解析装置120と、論文データベース130と、データベース群140とを備える。
【0301】
論文データベース130は、論文DBとも呼ばれ、それぞれドキュメントである複数の論文データを保持する記録媒体である。なお、論文データベース130は、実施の形態1~3におけるドキュメント蓄積部102に相当する。
【0302】
データベース群140は、それぞれ第1解析装置110および第2解析装置120の少なくとも一方に利用される記録媒体である複数のデータベースを含む。これらの複数のデータベースのそれぞれも、論文データベース130と同様、記録媒体として構成されている。これらの記録媒体は、例えばハードディスクである。なお、記録媒体は、ハードディスク以外の記録媒体、例えばRAM(Random Access Memory)、ROM(Read Only Memory)、または半導体メモリなどであってもよい。また、これらの記録媒体は、揮発性であっても不揮発性であってもよい。
【0303】
第1解析装置110は、論文データベース130から通信ネットワーク150を介して複数の論文データを読み出す。そして、第1解析装置110は、その複数の論文データのそれぞれについて、その論文データから各情報を顧客情報として抽出することによって、その論文データに対応するデータセットを生成する。第1解析装置110は、通信ネットワーク150を介して、その生成されたデータセットをデータベース群140に格納する。なお、本実施の形態では、論文の著者が所属する組織は、例えば大学、研究所、または企業などであって、装置または材料などの商品を販売する販売会社にとっての顧客である。
【0304】
第2解析装置120は、データベース群140から通信ネットワーク150を介してその複数のデータセットを読み出し、その複数のデータセットから、顧客による上記商品の購買に関する各種情報を推定する。なお、本実施の形態では、第2解析装置120は、例えば、上述の販売会社またはその販売会社に属する人に用いられる。
【0305】
なお、第1解析装置110、第2解析装置120、論文データベース130、およびデータベース群140は、同一の施設に設置されていてもよく、互に離れた複数の施設に分かれて配置されていてもよい。また、第1解析装置110および第2解析装置120は、異なるユーザによって利用されてもよく、同一ユーザによって利用されてもよい。
【0306】
[論文データ]
図34は、論文bibの内容の一例を示す図である。
【0307】
本実施の形態における論文データは、2つのファイルの組み合わせからなる。その2つのファイルの一方は、論文PDF(Portable Document Format)であり、他方は、論文bibである。論文PDFは、PDFファイルによって構成され、論文の内容が例えば自然言語によって記述されたファイルである。なお、この論文PDFには、テキストデータが含まれていてもよい。論文bibは、拡張子として「bib」が付されているファイルであって、BIBファイルとも呼ばれる。
【0308】
論文bibは、例えば
図34に示すように、論文のメタデータである。このような論文bibには、論文のタイトルと、その論文の著者の名称と、その著者が所属する組織の名称(Affiliation)と、その論文の発行日または出版日などとが記述されている。なお、著者の名称は、以下、著者名とも呼ばれ、組織の名称は、組織名、研究組織名または所属組織名とも呼ばれる。また、論文bibは、構造化されたデータである。
【0309】
したがって、本実施の形態における第1解析装置110は、コンピュータプログラムによる処理によって、その論文bibから上述の著者名、組織名、出版日などを容易に抽出することができる。
【0310】
【0311】
論文PDFには、
図35の(a)に示すように、例えば、その論文の実験などに用いられた装置に関する情報と、その装置を販売または製造した装置提供機関に関する情報とが記述されている。装置に関する情報は、装置情報とも呼ばれ、例えば装置の名称、別称、型式または型番である。装置提供機関に関する情報は、例えばその装置提供機関の名称である。なお、装置提供機関は、具体的には、その装置の販売会社または製造メーカであって、その装置の購入先とも言える。
【0312】
図35の(a)に示す例では、論文PDFには、装置の型番として「TN-200」が記述され、その装置の購入先の名称として「Korea Chem Inc.」が記述されている。さらに、その論文PDFには、装置の型番として「XRD,Gaku Mini II」が記述され、その装置の購入先の名称として「Japan Chem Inc.」が記述されている。
【0313】
また、論文PDFには、
図35の(b)に示すように、例えば、その論文の実験などに用いられた材料に関する情報と、その材料を販売または製造した材料提供機関に関する情報とが記述されている。材料に関する情報は、材料情報とも呼ばれ、例えば材料の名称または別称である。材料提供機関に関する情報は、例えばその材料提供機関の名称である。なお、材料提供機関は、具体的には、その材料の販売会社または製造メーカであって、その材料の購入先とも言える。
【0314】
図35の(b)に示す例では、論文PDFには、名称「Octylamine」の材料の購入先の名称として「China Industry」が記述されている。さらに、その論文PDFには、名称「Acetone and methanol」の材料の購入先の名称として「Sako Pure Chemicals Co.,Ltd」が記述されている。
【0315】
図36は、論文PDFの他の内容の一例を示す図である。
【0316】
論文PDFには、例えば
図36に示すように、さらに、その論文の実験を支援するプロジェクトに関する情報が記述されている。プロジェクトに関する情報は、プロジェクト情報とも呼ばれ、例えば、プロジェクトの名称または識別番号である。
【0317】
図36に示す例では、論文PDFには、プロジェクトの名称として「the National Material Science Fundation of Japan」が記述され、そのプロジェクトの識別番号として「No.11112222 and 33334444」が記述されている。さらに、その論文PDFには、プロジェクトの名称として「the the Specialized Research Fund for the Doctoral Program of Higher Education of Japan」が記述され、そのプロジェクトの識別番号として「No.ABC111」が記述されている。
【0318】
[システム詳細構成]
図37は、支援装置13の詳細な構成の一例を示す図である。
【0319】
第1解析装置110は、合成プロセス抽出部111と、抽出部112とを備える。
【0320】
合成プロセス抽出部111は、上記実施の形態1~3における合成プロセス生成装置100と同様、それぞれドキュメントの一例である複数の論文PDFから、合成プロセスを生成する。つまり、合成プロセス抽出部111は、論文PDFから合成プロセスを抽出する。そして、合成プロセス抽出部111は、その抽出された合成プロセスを、データベース群140に含まれる顧客データベース145に格納する。
【0321】
なお、この合成プロセス抽出部111は、上記実施の形態1~3における合成プロセス生成装置100に含まれる、ドキュメント蓄積部102以外の各構成要素から構成されていてもよい。
【0322】
抽出部112は、論文データベース130から複数の論文データをダウンロードする。これにより、論文データに含まれる論文PDFおよび論文bibが同時にダウンロードされる。そして、抽出部112は、そのダウンロードされた複数の論文データのそれぞれについて、その論文データに含まれる論文PDFおよび論文bibから、各情報を顧客情報として抽出する。そして、抽出部112は、その論文データから抽出された複数の顧客情報を含むデータセットを上述の顧客データベース145に格納する。
【0323】
また、抽出部112は、その顧客情報を論文データから抽出するときには、データベース群140に含まれる装置データベース141、材料データベース142、プロジェクトデータベース143、および単位辞書データベース144を用いる。
【0324】
第2解析装置120は、入力部121と、推定部122とを備える。
【0325】
入力部121は、第2解析装置120のユーザによる入力操作に応じて、各情報を受け付ける。このような入力部121は、例えばキーボード、タッチセンサ、タッチパッドまたはマウスなどとして構成されていてもよい。
【0326】
推定部122は、顧客データベース145と、後述の装置保守データベース146およびセールデータベース147とを用いて、顧客による商品の購買に関する各種情報を推定する。
【0327】
データベース群140は、装置データベース141、材料データベース142、プロジェクトデータベース143、単位辞書データベース144、顧客データベース145、装置保守データベース146、セールデータベース147、および、推定結果データベース148を備える。
【0328】
装置データベース141は、装置DBとも呼ばれ、複数の装置のそれぞれについて、その装置に関する複数の情報を保持している。その装置に関する複数の情報には、例えば、その装置の名称、価格、およびスペックなどがある。
【0329】
材料データベース142は、材料DBとも呼ばれ、複数の材料のそれぞれについて、その材料に関する複数の情報を保持している。その材料に関する複数の情報には、例えば、その材料の名称および価格などがある。
【0330】
プロジェクトデータベース143は、プロジェクトDBとも呼ばれ、複数のプロジェクトのそれぞれについて、そのプロジェクトに関する複数の情報を保持している。そのプロジェクトに関する複数の情報には、例えば、そのプロジェクトの名称および予算規模などがある。
【0331】
単位辞書データベース144は、単位辞書DBとも呼ばれ、重さの単位に関する情報を保持している。
【0332】
顧客データベース145は、顧客DBとも呼ばれる。このような顧客データベース145には、上述のように、合成プロセス抽出部111によって抽出された複数の合成プロセスと、抽出部112によって抽出された複数の顧客情報を含むデータセットとが格納される。
【0333】
装置保守データベース146は、装置保守DBとも呼ばれ、販売会社から販売される装置の故障に関する情報を保持している。装置の故障に関する情報は、例えば装置の故障率曲線である。この故障率曲線は、初期故障期間と、偶発故障期間と、摩耗故障期間とを示し、かつ、それらの各期間における故障率の時間変化を示す。初期故障期間は、装置の設計または製造の欠陥が故障の原因となりやすい期間である。偶発故障期間は、故障の原因が時間の経過に関係しない期間である。摩耗故障期間は、時間の経過とともに摩耗または損耗することなどが故障の原因となりやすい期間である。推定部122は、このような故障率曲線を用いて装置の故障率の時系列変化を推定する。なお、装置保守データベース146に保持されている上述の故障率曲線は、自動または手動で生成または更新され、例えば常に最新の状態に維持されている。
【0334】
セールデータベース147は、セールDBとも呼ばれ、セール条件を保持している。セール条件は、材料または装置の割引に関する条件であって、例えば、材料AをXg以上まとめて購入すると、その材料Aの価格が割引になるという条件である。推定部122は、このようなセール条件を参照して、顧客による商品の購買に関する各種情報を推定してもよい。なお、セールデータベース147に保持されているセール条件は、自動または手動で生成または更新され、例えば常に最新の状態に維持されている。
【0335】
推定結果データベース148は、推定結果DBとも呼ばれる。このような推定結果データベース148には、推定部122によって推定された情報、例えば後述の材料推定情報および装置推定情報などが格納される。
【0336】
[データベースと抽出部112の処理]
図38は、装置データベース141に保持されているデータテーブルの一例を示す図である。
【0337】
装置データベース141は、例えば
図38に示すデータテーブル141aを保持している。このデータテーブル141aは、複数の装置のそれぞれについて、その装置に関する複数の情報を示す。例えば、データテーブル141aは、複数の装置のそれぞれについて、その装置の装置ID、装置名称、装置別称、装置型番、販売会社名、関連装置ID、価格、使用開始月、およびスペックを関連付けて示す。装置IDは、その装置を識別するための識別情報であり、装置名称は、その装置の名称であり、装置別称は、その装置の名称とは異なる別の名称または略称である。また、装置型番は、その装置の販売会社によって定められたその装置の型番または型式である。販売会社名は、その装置の販売会社の名称である。関連装置IDは、その関連装置IDに関連付けられている装置IDを有する装置に関連する装置の識別情報であって、例えば、その装置IDを有する装置と同様の用途および機能を有する装置の識別情報である。価格は、その装置IDを有する装置の販売会社によって定められたその装置の価格であり、使用開始月は、その装置の使用が開始された月である。なお、使用開始月は、その装置の販売開始月であってもよい。スペックは、その装置の用途に応じた仕様である。例えば、ボールミル用途の装置のスペックは、ボール径、装置の材質、またはディスク回転数などを含む。一方、アニール用途の装置のスペックは、アニール方式(例えば遠赤外線照射か熱風併用など)、最大焼成温度、または雰囲気条件(窒素、アルゴン、酸素など)などを含む。
【0338】
具体的には、データテーブル141aは、装置ID「1」の装置について、その装置ID「1」と、その装置の装置名称「Ball Milling Machine」と、その装置の装置別称「BM」と、その装置の装置型番「BZ204B」と、その装置の販売会社名「Osaka Industries.」と、その装置の関連装置ID「[3,4]」と、その装置の価格「80,000円」と、その装置の使用開始月「2011年7月」と、その装置のスペックとを示す。なお、関連装置ID「[3,4]」は、装置ID「3」および「4」のそれぞれの装置が関連装置として、装置ID「1」の装置に関連していることを示す。
【0339】
なお、同じ装置名称および同じ装置型番を有する複数の装置であっても、それらの複数の装置のそれぞれの販売会社が互いに異なるときには、それらの複数の装置の価格も互いに異なっている場合がある。したがって、データテーブル141aでは、同じ装置名称および同じ装置型番を有する複数の装置であっても、それらの販売会社が互いに異なっている場合には、それらの複数の装置のそれぞれには互いに異なる装置IDが関連付けられている。
【0340】
このような装置データベース141のデータテーブル141aは、各装置販売会社がその会社のウェブページなどで公開するカタログを基に作成可能なデータテーブルである。このデータテーブル141aは、自動で作成されても、手動で作成されてもよい。また、装置販売会社が販売する装置のラインナップは継続的に更新されるため、装置データベース141に保持されるデータテーブル141aは常に最新の状態に更新されていてもよい。
【0341】
本実施の形態における抽出部112は、論文データ、例えば
図35の(a)に示す論文PDFから、BERT(Bidirectional Encoder Representations from Transformers)を用いて装置情報を抽出する。なお、BERTは、固有表現抽出で高い性能が報告されている深層学習に基づくモデルである。
【0342】
そして、抽出部112は、抽出された装置情報とマッチングする装置名称を、データテーブル141aから検索する。ここで、その装置名称が見つからなければ、抽出部112は、抽出された装置情報とマッチングする装置別称を、データテーブル141aから検索する。さらに、その装置別称が見つからなければ、抽出部112は、抽出された装置情報とマッチングする装置型番を、データテーブル141aから検索する。抽出部112は、その検索によって装置名称などが見つかると、データテーブル141aにおいてその装置名称などに関連付けられている装置ID、販売会社名、関連装置ID、価格などを、それぞれ装置に関する顧客情報として特定する。これにより、その論文データから装置に関する顧客情報が抽出される。そして、抽出部112は、それらの抽出された装置に関する顧客情報に、その論文データの論文IDを関連付ける。なお、論文IDは、論文データを識別するための識別情報である。
【0343】
ここで、各論文データに記載されている装置情報には表記揺れがある。つまり、装置情報として、正式な名称が記載されていたり、別称が記載されていたり、略称または型番が記載されている場合がある。このような場合には、顧客情報を適切に抽出することができないという課題が生じる可能性がある。したがって、本実施の形態では、上述のように、データテーブル141aの装置別称および装置型番を用いることによって、この表記揺れによる課題の発生を抑制することができる。例えば、「BM II」という装置情報が論文データから抽出された場合は、抽出部112は、データテーブル141aに示される各装置別称を参照する。そして、その抽出された装置情報とマッチングする装置別称がデータテーブル141aに示されていれば、抽出部112は、そのデータテーブル141aにおいてその装置別称に関連付けられている装置IDなどを装置に関する顧客情報として特定する。これにより、その装置の正式な名称が例えば「Ball Miling II」であっても、「Ball Miling II」と「BM II」との名称の表記揺れによる課題の発生を抑制することができる。
【0344】
なお、抽出された装置情報とマッチングする装置名称、装置別称または装置型番がデータテーブル141aに示されていない場合には、第1解析装置110は、データテーブル141aを更新してもよい。つまり、第1解析装置110は、その抽出された装置情報が新規装置名称としてデータテーブル141aに含まれるように、そのデータテーブル141aを更新する。具体的には、第1解析装置110は、装置データベース141の管理者にメールなどで新規装置名称の通知を行う。これによって、その管理者に対して、新規装置名称の確認が促され、さらに、その新規装置名称に対応する装置型番、販売会社名、および価格などの追加が促される。その結果、データテーブル141aが更新され、装置情報の表記揺れによる課題の発生をより抑制することができる。
【0345】
また、本実施の形態における抽出部112は、上述のように、BERTを用いて論文データから装置情報を抽出するが、データテーブル141aに示されている装置名称、装置別称、装置型番などを検索してもよい。具体的には、抽出部112は、データテーブル141aに示されている各装置名称を論文PDFから検索し、何れの装置名称も見つからなければ、データテーブル141aに示されている各装置別称を論文PDFから検索する。そして、抽出部112は、何れの装置別称も見つからなければ、データテーブル141aに示されている各装置型番を論文PDFから検索する。抽出部112は、装置名称、装置別称、または装置型番が見つかると、データテーブル141aにおいてその装置名称などに関連付けられている装置ID、販売会社名、関連装置ID、価格などを、それぞれ装置に関する顧客情報として特定する。これにより、その論文データから装置に関する顧客情報が抽出される。
【0346】
図39は、材料データベース142に保持されているデータテーブルの一例を示す図である。
【0347】
材料データベース142は、例えば
図39に示すデータテーブル142aを保持している。このデータテーブル142aは、複数の材料のそれぞれについて、その材料に関する複数の情報を示す。例えば、データテーブル142aは、複数の材料のそれぞれについて、その材料の材料ID、材料名称、材料別称、販売会社名、および価格を関連付けて示す。材料IDは、その材料を識別するための識別情報であり、材料名称は、その材料の組成式であり、材料別称は、その材料の組成式とは異なる別の名称または略称である。販売会社名は、その材料の販売会社の名称である。価格は、その材料の販売会社によって定められたその材料1gあたりの価格である。
【0348】
具体的には、データテーブル142aは、材料ID「3」の材料について、その材料ID「3」と、その材料の材料名称「LiPON」と、その材料の材料別称「Lithium phosphorus oxynitride」と、その材料の販売会社名「Nakamura Material」と、その材料1gあたりの価格「1500円」とを示す。
【0349】
なお、同じ材料名称を有する複数の材料であっても、それらの複数の材料のそれぞれの販売会社が互いに異なるときには、それらの複数の材料の価格も互いに異なっている場合がある。したがって、データテーブル142aでは、同じ材料名称を有する複数の材料であっても、それらの販売会社が互いに異なっている場合には、それらの複数の材料のそれぞれには互いに異なる材料IDが関連付けられている。
【0350】
このような材料データベース142のデータテーブル142aは、各材料販売会社がその会社のウェブページなどで公開するカタログを基に作成可能なデータテーブルである。このデータテーブル142aは、自動で作成されても、手動で作成されてもよい。また、材料販売会社が販売する材料のラインナップは継続的に更新されるため、材料データベース142に保持されるデータテーブル142aは常に最新の状態に更新されていてもよい。
【0351】
本実施の形態における抽出部112は、論文データ、例えば
図35の(b)に示す論文PDFから、上述と同様、BERTを用いて材料情報を抽出する。そして、抽出部112は、抽出された材料情報とマッチングする材料名称を、データテーブル142aから検索する。ここで、その材料名称が見つからなければ、抽出部112は、抽出された材料情報とマッチングする材料別称を、データテーブル142aから検索する。抽出部112は、その検索によって材料名称などが見つかると、データテーブル142aにおいてその材料名称などに関連付けられている材料ID、販売会社名、価格などを、それぞれ材料に関する顧客情報として特定する。これにより、その論文データから材料に関する顧客情報が抽出される。そして、抽出部112は、それらの抽出された材料に関する顧客情報に、その論文データの論文IDを関連付ける。
【0352】
ここで、各論文データに記載されている材料情報には表記揺れがある。つまり、材料情報として、正式な名称が記載されていたり、別称が記載されていたり、略称が記載されている場合がある。このような場合には、顧客情報を適切に抽出することができないという課題が生じる可能性がある。したがって、本実施の形態では、上述のように、データテーブル142aの材料別称を用いることによって、この表記揺れによる課題の発生を抑制することができる。例えば、「Lithium phosphorus oxynitride」という材料情報が論文データから抽出された場合は、抽出部112は、データテーブル142aに示される各材料別称を参照する。そして、その抽出された材料情報とマッチングする材料別称がデータテーブル142aに示されていれば、抽出部112は、そのデータテーブル142aにおいてその材料別称に関連付けられている材料IDなどを顧客情報として特定する。これにより、その材料の正式な名称が例えば「LiPON」であっても、「LiPON」と「Lithium phosphorus oxynitride」との名称の表記揺れによる課題の発生を抑制することができる。
【0353】
なお、抽出された材料情報とマッチングする材料名称または材料別称がデータテーブル142aに示されていない場合には、第1解析装置110は、データテーブル142aを更新してもよい。つまり、第1解析装置110は、その抽出された材料情報が新規材料名称としてデータテーブル142aに含まれるように、そのデータテーブル142aを更新する。具体的には、第1解析装置110は、材料データベース142の管理者にメールなどで新規材料名称の通知を行う。これによって、その管理者に対して、新規材料名称の確認が促され、さらに、その新規材料名称に対応する装置別称、販売会社名、および価格などの追加が促される。その結果、データテーブル142aが更新され、材料情報の表記揺れによる課題の発生をより抑制することができる。
【0354】
また、本実施の形態における抽出部112は、上述のように、BERTを用いて論文データから材料情報を抽出するが、データテーブル142aに示されている材料名称または材料別称を検索してもよい。具体的には、抽出部112は、データテーブル142aに示されている各材料名称を論文PDFから検索し、何れの材料名称も見つからなければ、データテーブル142aに示されている各材料別称を論文PDFから検索する。抽出部112は、材料名称または材料別称が見つかると、データテーブル142aにおいてその材料名称などに関連付けられている材料ID、販売会社名、価格などを、それぞれ材料に関する顧客情報として特定する。これにより、その論文データから材料に関する顧客情報が抽出される。
【0355】
図40は、プロジェクトデータベース143に保持されているデータテーブルの一例を示す図である。
【0356】
プロジェクトデータベース143は、例えば
図40に示すデータテーブル143aを保持している。このデータテーブル143aは、複数のプロジェクトのそれぞれについて、そのプロジェクトに関する複数の情報を示す。例えば、データテーブル142aは、複数のプロジェクトのそれぞれについて、そのプロジェクトのプロジェクトID、プロジェクト名称、プロジェクト別称、プロジェクト識別番号、開始年度、終了年度、および予算規模を関連付けて示す。プロジェクトIDは、そのプロジェクトを識別するための識別情報であり、プロジェクト名称は、そのプロジェクトの名称であり、プロジェクト別称は、そのプロジェクトの名称とは異なる別の名称または略称である。プロジェクト識別番号は、そのプロジェクトの予算の発行元によって定められた、そのプロジェクトの識別番号である。なお、予算の発行元は、その予算を支払う組織、またはその予算を決定する組織であってもよい。開始年度は、その発行元によって定められた、そのプロジェクトが開始される年度であり、終了年度は、その発行元によって定められた、そのプロジェクトが終了される年度である。予算規模は、その発行元によって定められた、そのプロジェクトの予算である。
【0357】
具体的には、データテーブル143aは、プロジェクトID「1」のプロジェクトについて、そのプロジェクトID「1」と、そのプロジェクトのプロジェクト名称「Fund of material research」と、そのプロジェクトのプロジェクト別称「MAT」と、そのプロジェクトのプロジェクト識別番号「234-3344」と、そのプロジェクトの開始年度「2018年度」と、そのプロジェクトの終了年度「2020年度」と、そのプロジェクトの予算規模「2000万円」とを示す。
【0358】
このようなプロジェクトデータベース143のデータテーブル143aは、研究組織を支援する支援組織がウェブページなどで公開する、例えば国家プロジェクトなどの各プロジェクトの情報に基づいて作成可能なデータテーブルである。このデータテーブル143aは、自動で作成されても、手動で作成されてもよい。また、プロジェクトの情報は継続的に更新されるため、プロジェクトデータベース143に保持されるデータテーブル143aは常に最新の状態に更新されていてもよい。
【0359】
本実施の形態における抽出部112は、論文データ、例えば
図36に示す論文PDFから、上述と同様、BERTを用いてプロジェクト情報を抽出する。
【0360】
ここで、複数のプロジェクトのそれぞれでは、プロジェクト識別番号のフォーマットまたはパターンが互いに異なっている場合がある。したがって、本実施の形態における抽出部112は、プロジェクト情報を抽出すると、プロジェクト識別番号に対して予め定められた各パターンに、そのプロジェクト情報がマッチングするか否かを判定する。例えば、プロジェクト識別番号のパターンには、「No.1234」のように数字の直前に「No.」が配置されるパターンと、「1233-3333」のようにハイフンによって数字が区切られたパターンと、「AB1234」のようにアルファベットと数字が混在するパターンとがある。抽出部112は、論文から抽出されたプロジェクト情報が、上述の何れかのパターンにマッチングすると判定すると、そのプロジェクト情報をプロジェクト識別番号に分類する。一方、抽出部112は、その論文から抽出されたプロジェクト情報が、上述の何れのパターンにもマッチングしないと判定すると、そのプロジェクト情報を、プロジェクト名称またはプロジェクト別称に分類する。
【0361】
そして、抽出部112は、抽出されたプロジェクト情報がプロジェクト名称またはプロジェクト別称に分類された場合には、そのプロジェクト情報とマッチングするプロジェクト名称を、データテーブル143aから検索する。ここで、そのプロジェクト名称が見つからなければ、抽出部112は、抽出されたプロジェクト情報とマッチングするプロジェクト別称を、データテーブル143aから検索する。抽出部112は、その検索によってプロジェクト名称などが見つかると、データテーブル143aにおいてそのプロジェクト名称などに関連付けられているプロジェクトID、開始年度、終了年度、予算規模などを、それぞれプロジェクトに関する顧客情報として特定する。同様に、抽出部112は、抽出されたプロジェクト情報がプロジェクト識別番号に分類された場合には、そのプロジェクト情報とマッチングするプロジェクト識別番号を、データテーブル143aから検索する。抽出部112は、その検索によってプロジェクト識別番号が見つかると、データテーブル143aにおいてそのプロジェクト識別番号に関連付けられているプロジェクトID、開始年度、終了年度、予算規模などを、それぞれプロジェクトに関する顧客情報として特定する。これにより、その論文データからプロジェクトに関する顧客情報が抽出される。
【0362】
なお、本実施の形態における抽出部112は、上述のように、BERTを用いて論文データからプロジェクト情報を抽出するが、データテーブル143aに示されているプロジェクト名称、プロジェクト別称、プロジェクト識別番号などを検索してもよい。具体的には、抽出部112は、データテーブル143aに示されている各プロジェクト名称を論文PDFから検索し、何れのプロジェクト名称も見つからなければ、データテーブル143aに示されている各プロジェクト別称を論文PDFから検索する。そして、抽出部112は、何れのプロジェクト別称も見つからなければ、データテーブル143aに示されている各プロジェクト識別番号を論文PDFから検索する。抽出部112は、プロジェクト名称などが見つかると、データテーブル143aにおいてそのプロジェクト名称などに関連付けられているプロジェクトID、開始年度、終了年度、予算規模などを、それぞれプロジェクトに関する顧客情報として特定する。これにより、その論文データからプロジェクトに関する顧客情報が抽出される。
【0363】
図41は、単位辞書データベース144に保持されているデータテーブルの一例を示す図である。
【0364】
単位辞書データベース144は、例えば
図41に示すデータテーブル144aを保持している。このデータテーブル144aは、重さの単位に用いられる複数の単位記号と、それらの単位記号に対応する数値表記とを関連付けて示す。複数の単位記号は、「g」、「mg」および「μg」などである。単位記号「g」に対応する数値表記は、「1」であり、単位記号「mg」に対応する数値表記は、「0.001」であり、単位記号「μg」に対応する数値表記は、「0.000001」である。これらの数値表記は、単位記号「mg」および「μg」などで表現される重さを、単位記号「g」で表現される重さ、すなわちグラム量に変換するために用いられる。
【0365】
本実施の形態における抽出部112は、このようなデータテーブル144aを用いて、論文データ、具体的には論文PDFから、単位記号「g」で表記される材料の重さを抽出する。つまり、抽出部112は、論文データから材料の重さをグラム量として抽出する。具体的には、抽出部112は、データテーブル144aに示される複数の単位記号のそれぞれを論文データから検索し、何れかの単位記号が見つかれば、その単位記号と、その単位記号の直前に記載されている数値とを、その論文データから抽出する。そして、抽出部112は、データテーブル144aにおいて、その抽出された単位記号に関連付けられている数値表記を参照し、その数値表記の数値と、論文PDFから抽出された数値とを乗算する。これによって、抽出部112は、単位記号「g」で表記される材料の重さ、すなわちグラム量を算出する。その結果、材料のグラム量が論文PDFから抽出される。例えば、抽出部112は、論文データから単位記号「mg」が見つかれば、その単位記号「mg」と、その単位記号「mg」の直前に記載されている数値「1」とを、その論文データから抽出する。すなわち「1mg」が抽出される。そして、抽出部112は、データテーブル144aにおいて、その抽出された単位記号「mg」に関連付けられている数値表記「0.001」を参照する。次に、抽出部112は、その数値表記の数値「0.001」×数値「1」の乗算によって、単位記号「g」で表記される材料の重さであるグラム量「0.001」を算出する。その結果、グラム量「0.001g」が論文PDFから抽出される。
【0366】
また、抽出部112は、上述のように、材料データベース142を用いて論文データから材料IDなどの顧客情報を抽出する。さらに、抽出部112は、単位辞書データベース144を用いて論文データから材料のグラム量を抽出する。そこで、抽出部112は、それぞれ同一の論文データから抽出されたグラム量と材料IDとを関連付ける。したがって、その論文データの論文ID、材料IDおよびグラム量が関連付けられる。また、このような材料IDに関連付けられたグラム量は、材料IDと同様に、顧客情報として扱われる。
【0367】
なお、同一の論文データから複数の材料IDと複数のグラム量とが抽出される場合には、材料IDとグラム量との関連付け、すなわちペアリングは、その論文データにおいて材料情報および単位記号などが記載されている位置に基づいて行われてもよい。例えば、抽出部112は、材料IDに対応する材料情報が記載されている位置に最も近い単位記号および数値を特定し、その単位記号および数値に対応するグラム量を、その材料IDに関連付ける。
【0368】
図42は、組織識別テーブルおよび著者識別テーブルの一例を示す図である。
【0369】
抽出部112は、例えば、
図42の(a)に示す組織識別テーブルT1と、
図42の(b)に示す著者識別テーブルT2とを、それぞれ顧客データベース145の付属データとして生成してその顧客データベース145に格納する。
【0370】
具体的には、抽出部112は、例えば論文bibから組織名を抽出すると、その組織名に対する組織IDを決定し、その組織IDと組織名とを関連付けて組織識別テーブルT1に含める。組織名に関連付けられる組織IDは、例えば、その組織名が抽出された順にしたがって決定されてもよい。
【0371】
組織識別テーブルT1は、複数の組織のそれぞれについて、その組織の識別情報である組織IDと、その組織の名称である組織名とを関連付けて示す。例えば、組織識別テーブルT1は、組織ID「1」と、その組織ID「1」を有する組織の組織名「A大学」とを関連付けて示す。
【0372】
また、抽出部112は、例えば論文bibから著者名を抽出すると、その著者名に対する著者IDを決定し、その著者IDと著者名とを関連付けて著者識別テーブルT2に含める。著者名に関連付けられる著者IDは、例えば、その著者名が抽出された順にしたがって決定されてもよい。
【0373】
著者識別テーブルT2は、複数の著者のそれぞれについて、その著者の識別情報である著者IDと、その著者の名称である著者名とを関連付けて示す。例えば、著者識別テーブルT2は、著者ID「1」の著者について、その著者の著者ID「1」と、その著者の著者名「K.Sasaki」とを関連付けて示す。
【0374】
なお、科学技術論文は、複数の著者によって作成されている場合が多い。また、著者が複数の組織に所属していたり、複数の著者のそれぞれが大学と企業のように互いに異なる組織に所属していたりする場合がある。その場合は、著者ごとに、発表されているその著者の論文を検索し、検索された論文のテキスト情報を利用することで、その著者が属する組織(大学または企業など)を特定することが可能になる。
【0375】
また、学生が大学を卒業し、企業に研究者として就職することなどによって、その学生または研究者である人が著者として互いに異なる組織で論文発表を行う場合がある。人の組織間の移動が起こった場合、複数の論文の間で、著者名は同一であっても、著者の所属組織が異なるため、その著者が特定できなくなってしまうことがある。
【0376】
したがって、抽出部112は、ORCID(Open Researcher and Contributor ID)などのような、人を一意的に識別するためのコードを、著者名と関連付けて著者識別テーブルT2に含めてもよい。これにより、複数の組織のそれぞれで同一著者名の著者が論文発表をした際、その著者を特定できなくなってしまう問題を解決することができる。また、本実施の形態における論文データに、ORCIDが含まれている場合には、抽出部112は、そのORCIDを論文データから抽出してもよい。
【0377】
また、近年は、研究者自身あるいは研究者が所属する研究室の、ホームページまたはSNS(social networking service)などで、発表論文リストまたは研究者の経歴などが公開されている場合がある。したがって、論文から抽出された論文タイトルを、Web検索によって検索することによって、その論文を作成した研究者のホームページを見つけ、そのホームページに公開されている発表論文リストまたは経歴から、研究者を識別してもよい。また、「Google(登録商標) Scholar」などの論文検索サイトで論文タイトルを検索することにより、論文の著者を特定することもできる。
【0378】
図43Aは、顧客データベース145に格納されるデータテーブルの一例を示す図である。
【0379】
顧客データベース145には、例えば
図43Aに示すデータテーブル145aが格納される。このデータテーブル145aは、複数の論文データのそれぞれについて、その論文データに関するデータセットを含む。論文データのデータセットは、その論文データの論文ID、著者リスト、組織リスト、装置関連情報、プロジェクト関連情報、材料関連情報、および出版月を関連付けて示す。論文IDは、論文データを識別するための識別情報である。著者リストは、論文データに記載されている少なくとも1つの著者名のそれぞれに対応する著者IDをリスト形式で示す。組織リストは、論文データに記載されている少なくとも1つの組織名のそれぞれに対応する組織IDをリスト形式で示す。装置関連情報は、論文データに記載されている少なくとも1つの装置情報のそれぞれについて、その装置情報によって特定される装置の装置IDと、その装置の価格との組み合わせを辞書形式で示す。プロジェクト関連情報は、論文データに記載されている少なくとも1つのプロジェクト情報のそれぞれについて、そのプロジェクト情報によって特定されるプロジェクトのプロジェクトIDと、そのプロジェクトの予算規模との組み合わせを辞書形式で示す。材料関連情報は、論文データに記載されている少なくとも1つの材料情報のそれぞれについて、その材料情報によって特定される材料の材料IDと、その材料のグラム量との組み合わせを辞書形式で示す。出版月は、論文データが出版または発行された月であって、上述の出版日または発行日を含む月である。
【0380】
本実施の形態における抽出部112は、論文データベース130から論文データをダウンロードすると、その論文データに対して論文IDを割り当てる。そして、抽出部112は、その論文データの論文bibから出版日または発行日を抽出して、その出版日または発行日を含む月を出版月として特定する。さらに、抽出部112は、装置データベース141、材料データベース142、プロジェクトデータベース143、および単位辞書データベース144を用いて、上述のように、その論文データから各顧客情報を抽出する。さらに、抽出部112は、その論文データの論文bibから組織名を抽出すると、組織識別テーブルT1においてその組織名に関連付けられている組織IDを特定する。同様に、抽出部112は、その論文データの論文bibから著者名を抽出すると、著者識別テーブルT2においてその著者名に関連付けられている著者IDを特定する。
【0381】
抽出部112は、その論文データに対して割り当てられた論文IDと、その論文データに対して特定された組織IDおよび著者IDと、その論文データから抽出された各顧客情報と、その論文データから特定された出版月とを用いて、上述の論文データのデータセットを生成する。
【0382】
具体的には、抽出部112は、例えば、論文データに対して割り当てられた論文ID「1」と、その論文データから特定された出版月「2019年6月」とを、その論文データのデータセットに含める。さらに、抽出部112は、論文ID「1」の論文データの論文bibから少なくとも1つの著者名を抽出する。抽出部112は、その抽出された少なくとも1つの著者名のそれぞれについて、
図42の(b)の著者識別テーブルT2においてその著者名に関連付けられている著者IDを選択する。そして、抽出部112は、その選択された少なくとも1つの著者IDを含む著者リスト、例えば[1,2]を生成し、その著者リスト[1,2]をその論文データのデータセットに含める。なお、この著者リスト[1,2]は、著者ID「1」と著者ID「2」とを含む。
【0383】
同様に、抽出部112は、論文ID「1」の論文データの論文bibから少なくとも1つの組織名を抽出する。抽出部112は、その抽出された少なくとも1つの組織名のそれぞれについて、
図42の(a)の組織識別テーブルT1においてその組織名に関連付けられている組織IDを選択する。そして、抽出部112は、その選択された少なくとも1つの組織IDを含む組織リスト、例えば[1]を生成し、その組織リスト[1]をその論文データのデータセットに含める。なお、この組織リスト[1]は、組織ID「1」を含む。
【0384】
さらに、抽出部112は、装置データベース141を用いて論文データから上述のように抽出された装置に関する顧客情報を用いて、その論文データの装置関連情報を生成する。例えば、抽出部112は、論文ID「1」の論文データからそれぞれ装置に関する顧客情報として抽出された装置IDと価格とを組み合わせることによって、装置関連情報{(1:2,000,000),(2:90,000)}を生成する。そして、抽出部112は、その生成された装置関連情報{(1:2,000,000),(2:90,000)}をその論文データのデータセットに含める。なお、装置関連情報{(1:2,000,000),(2:90,000)}は、装置ID「1」と価格「200万円」との組み合わせと、装置ID「2」と価格「9万円」との組み合わせとを含む。
【0385】
同様に、抽出部112は、プロジェクトデータベース143を用いて論文データから上述のように抽出されたプロジェクトに関する顧客情報を用いて、その論文データのプロジェクト関連情報を生成する。例えば、抽出部112は、論文ID「1」の論文データからそれぞれプロジェクトに関する顧客情報として抽出されたプロジェクトIDと予算規模とを組み合わせることによって、プロジェクト関連情報{(2:20,000,000),(3:90,000,000)}を生成する。そして、抽出部112は、その生成されたプロジェクト関連情報{(2:20,000,000),(3:90,000,000)}をその論文データのデータセットに含める。なお、プロジェクト関連情報{(2:20,000,000),(3:90,000,000)}は、プロジェクトID「2」と予算規模「2000万円」との組み合わせと、プロジェクトID「2」と価格「9000万円」との組み合わせを含む。
【0386】
同様に、抽出部112は、材料データベース142を用いて論文データから上述のように抽出された材料に関する顧客情報を用いて、その論文データの材料関連情報を生成する。例えば、抽出部112は、論文ID「1」の論文データからそれぞれ材料に関する顧客情報として抽出された材料IDとグラム量とを組み合わせることによって、材料関連情報{2:0.1}を生成する。そして、抽出部112は、その生成された材料関連情報{2:0.1}をその論文データのデータセットに含める。なお、材料関連情報{2:0.1}は、材料ID「2」とグラム量「0.1g」との組み合わせを含む。
【0387】
このように、本実施の形態における抽出部112は、ダウンロードされた複数の論文データのそれぞれに対して、その論文データのデータセットを生成する。そして、抽出部112は、それらのデータセットを顧客データベース145に格納する。これによって、それらのデータセットからなるデータテーブル145aが顧客データベース145に格納される。なお、論文データは継続的に出版または発行される。したがって、抽出部112は、データセットの生成を例えば定期的に行うことによって、その顧客データベース145のデータテーブル145aを最新の状態に維持する。
【0388】
図43Bは、顧客データベース145に格納されるデータテーブルの他の例を示す図である。
【0389】
顧客データベース145には、
図43Bに示すデータテーブル145bが格納されてもよい。このデータテーブル145bには、
図43Aに示すデータテーブル145aに含まれている材料関連情報が含まれていない。この点において、データテーブル145bはデータテーブル145aと異なるが、その点以外については、データテーブル145bは、データテーブル145aと同様の情報を示す。
【0390】
例えば、抽出部112は、論文データから材料に関する顧客情報を抽出することができなかった場合などには、論文データに対して材料関連情報を含まないデータセットを生成して顧客データベース145に格納してもよい。これにより、複数の論文データのそれぞれから材料に関する顧客情報が抽出されなかった場合には、顧客データベース145には、
図43Bに示すデータテーブル145bが格納される。あるいは、抽出部112は、装置の販売会社向けのために、材料関連情報が省かれたデータテーブル145bを顧客データベース145に格納してもよい。
【0391】
図43Cは、顧客データベース145に格納されるデータテーブルの他の例を示す図である。
【0392】
顧客データベース145には、
図43Cに示すデータテーブル145cが格納されてもよい。このデータテーブル145cには、
図43Aに示すデータテーブル145aに含まれている装置関連情報が含まれていない。この点において、データテーブル145cはデータテーブル145aと異なるが、その点以外については、データテーブル145cは、データテーブル145aと同様の情報を示す。
【0393】
例えば、抽出部112は、論文データから装置に関する顧客情報を抽出することができなかった場合などには、論文データに対して装置関連情報を含まないデータセットを生成して顧客データベース145に格納してもよい。これにより、複数の論文データのそれぞれから装置に関する顧客情報が抽出されなかった場合には、顧客データベース145には、
図43Cに示すデータテーブル145cが格納される。あるいは、抽出部112は、材料の販売会社向けのために、装置関連情報が省かれたデータテーブル145cを顧客データベース145に格納してもよい。
【0394】
このように、本実施の形態では、支援装置13は、第1解析装置110を備える。第1解析装置110は、以下の(b-1)~(b-3)をi=1~nで実行し、複数のデータセットであるデータセット1~データセットnを生成する。なお、データセット1~データセットnは、例えば
図43Aに示す顧客データベース145のデータテーブル145aに含まれるn個のデータセットである。また、これらのデータセットのそれぞれは、論文IDなどを含む。第1解析装置110は、(b-1)では、ドキュメントiの著者と、その著者が属する組織とのうちの少なくとも一方に関する情報を著者関連情報iとしてドキュメントiから抽出する。例えば、著者関連情報iは、
図43Aの著者リストおよび組織リストに相当する。また、第1解析装置110は、(b-2)では、装置に関する情報を装置関連情報iとしてドキュメントiから抽出する。例えば、装置関連情報iは、
図43Aの装置関連情報に相当する。また、第1解析装置110は、(b-3)では、著者関連情報iと装置関連情報iとを関連付けて示すデータセットiを生成する。つまり、上述の著者リストおよび組織リストと装置関連情報とを含むデータセットが生成される。
【0395】
これにより、ドキュメント1~ドキュメントnから、データセット1~データセットnが生成される。そのデータセットiは、ドキュメントiの著者関連情報iおよび装置関連情報iを関連付けて示すため、そのデータセット1~データセットnを見れば、どの著者または組織がどのような装置を用いているかを容易に把握することができる。したがって、装置販売会社による営業活動の効率化を図ることができる。
【0396】
また、本実施の形態では、第1解析装置110は、その複数のデータセットの生成では、さらに、以下の(b-4)をi=1~nで実行する。つまり、第1解析装置110は、(b-4)では、材料の種別に関する情報を材料情報iとしてドキュメントiから抽出する。そして、第1解析装置110は、(b-3)では、その材料情報iを著者関連情報iにさらに関連付けて示すデータセットiを生成する。例えば、その材料情報iは、
図43Aの材料関連情報に含まれる材料IDであってもよい。
【0397】
これにより、そのデータセットiは、ドキュメントiの著者関連情報iおよび材料情報iを関連付けて示すため、そのデータセット1~データセットnを見れば、どの著者または組織がどのような材料を用いているかを容易に把握することができる。したがって、材料販売会社による営業活動の効率化を図ることができる。
【0398】
また、本実施の形態では、第1解析装置110は、その複数のデータセットの生成では、さらに、以下の(b-5)をi=1~nで実行する。つまり、第1解析装置110は、(b-5)では、材料の量に関する情報を量情報iとしてドキュメントiから抽出する。そして、第1解析装置110は、(b-3)では、その量情報iを著者関連情報iにさらに関連付けて示すデータセットiを生成する。例えば、その量情報iは、
図43Aの材料関連情報に含まれるグラム量であってもよい。
【0399】
これにより、そのデータセットiは、ドキュメントiの著者関連情報i、材料情報iおよび量情報iを関連付けて示す。したがって、そのデータセット1~データセットnを見れば、どの著者または組織がどのような材料をどれだけ用いているかを容易に把握することができる。したがって、材料販売会社による営業活動の効率化をさらに図ることができる。
【0400】
また、本実施の形態では、第1解析装置110は、その複数のデータセットの生成では、さらに、以下の(b-6)をi=1~nで実行する。つまり、第1解析装置110は、(b-6)では、著者または組織を支援するプロジェクトに関する情報をプロジェクト関連情報iとしてドキュメントiから抽出する。そして、第1解析装置110は、(b-3)では、そのプロジェクト関連情報iを著者関連情報iにさらに関連付けて示すデータセットiを生成する。例えば、そのプロジェクト関連情報iは、
図43Aのプロジェクト関連情報であってもよい。
【0401】
これにより、そのデータセットiは、ドキュメントiの著者関連情報iおよびプロジェクト関連情報を関連付けて示す。したがって、そのデータセット1~データセットnを見れば、どの著者または組織がどのようなプロジェクトによる支援を受けているかを容易に把握することができる。したがって、その著者または組織の支払能力を推定することができ、その著者または組織に対する営業活動の効率化をさらに図ることができる。
【0402】
[第2解析装置の処理]
第2解析装置120の推定部122は、顧客データベース145からデータテーブル145aを取得し、そのデータテーブル145aを組織データテーブルに変換する。
【0403】
図44は、組織データテーブルの一例を示す図である。
【0404】
推定部122は、顧客データベース145のデータテーブル145aに含まれる各データセットを組織IDでソートすることによって、そのデータテーブル145aを、例えば
図44に示す組織データテーブル145xに変換する。
【0405】
組織データテーブル145xは、
図44に示すように、複数の組織のそれぞれについて、その組織の組織ID、装置関連情報、プロジェクト関連情報、材料関連情報、および論文著者情報を関連付けて示す。
【0406】
推定部122は、顧客データベース145のデータテーブル145aを組織データテーブル145xに変換するときには、そのデータテーブル145aに含まれる複数の組織リストを参照する。そして、推定部122は、それらの組織リストから複数の組織IDを例えば昇順に選択する。推定部122は、データテーブル145aにおいて選択された組織IDに関連付けられている全ての装置関連情報を組み合わせることによって、辞書形式の1つの新たな装置関連情報を生成する。例えば、推定部122は、データテーブル145aにおいて組織ID「2」に関連付けられている全ての装置関連情報を組み合わせることによって、1つの新たな装置関連情報{(2:400,000),(3:4,000,000),(4:8,000,000),(5:12,000,000),(6:400,000)}を生成する。
【0407】
また、データテーブル145aにおける複数のデータセットのそれぞれに、同一の組織IDに関連付けられている同一の装置IDが含まれている場合がある。言い換えれば、同一の組織から発行されている複数の論文データのそれぞれで、同一の装置とその価格が記載されている場合がある。このような場合には、推定部122は、それらのデータセットに含まれる同一の装置IDに対応する価格の合計、すなわち、複数の論文のそれぞれに記載されている同一の装置の価格の合計を算出する。例えば、データテーブル145aにおいて、組織ID「2」および論文ID「1」を有するデータセットと、同一の組織ID「2」および他の論文ID「2」を有するデータセットとのそれぞれに、装置関連情報として{1:1,000,000}が含まれている場合を想定する。つまり、組織ID「2」の組織から発行されている、論文ID「1」と論文ID「2」のそれぞれの論文データには、装置ID「1」の装置と、その装置の価格「100万円」とが記載されている。このような場合、推定部122は、それらのデータセットに含まれる装置ID「1」に対応する価格「100万円」の合計価格「100万円+100万円=200万円」を算出する。これにより、推定部122は、1つの新たな装置関連情報{1:2,000,000}を生成する。
【0408】
このように、組織IDごとに、論文の実験に使用される装置の合計価格が算出されるため、組織ごとにどの種類の装置がどれくらい購入されているかを把握することができる。例えば、組織Xにおいて、装置Aの合計価格が装置Bの合計価格を上回る場合は、組織Xにおいて装置Aの需要が装置Bよりも高いと解釈することができる。
【0409】
続いて、推定部122は、データテーブル145aにおいて選択された組織IDに関連付けられている全てのプロジェクト関連情報を組み合わせることによって、辞書形式の1つの新たなプロジェクト関連情報を生成する。例えば、推定部122は、データテーブル145aにおいて組織ID「2」に関連付けられている全てのプロジェクト関連情報を組み合わせることによって、1つの新たなプロジェクト関連情報{(2:400,000),(3:4,000,000),(4:8,000,000),(5:12,000,000),(6:400,000)}を生成する。
【0410】
続いて、推定部122は、データテーブル145aにおいて選択された組織IDに関連付けられている全ての材料関連情報を組み合わせることによって、辞書形式の1つの新たな材料関連情報を生成する。例えば、推定部122は、データテーブル145aにおいて組織ID「2」に関連付けられている全ての材料関連情報を組み合わせることによって、1つの新たな材料関連情報{1:0.1,2:0.4,3:0.7}を生成する。
【0411】
また、データテーブル145aにおける複数のデータセットのそれぞれに、同一の組織IDに関連付けられている同一の材料IDが含まれている場合がある。言い換えれば、同一の組織から発行されている複数の論文データのそれぞれで、同一の材料とその重さが記載されている場合がある。このような場合には、推定部122は、それらのデータセットに含まれる同一の材料IDに対応するグラム量の合計、すなわち、複数の論文のそれぞれに記載されている同一の材料の重さの合計を算出する。例えば、データテーブル145aにおいて、組織ID「2」および論文ID「1」を有するデータセットと、同一の組織ID「2」および他の論文ID「2」を有するデータセットとに、材料関連情報として{1:0.1}と{1:0.2}とがそれぞれ含まれている場合を想定する。つまり、組織ID「2」の組織から発行されている論文ID「1」の論文データには、材料ID「1」の材料(例えばLiPON)と、その材料の重さ「0.1g」とが記載されている。さらに、同一の組織ID「2」の組織から発行されている他の論文ID「2」の論文データには、材料ID「1」の材料(例えばLiPON)と、その材料の重さ「0.2g」とが記載されている。このような場合、推定部122は、それらのデータセットに含まれる材料ID「1」に対応するグラム量「0.1g」および「0.2g」の合計グラム量「0.1g+0.2g=0.3g」を算出する。これにより、推定部122は、1つの新たな材料関連情報{1:0.3}を生成する。
【0412】
なお、科学技術論文での実験データでは、実験の再現性が重視される。合成プロセスの実験でも、1回の実験での結果ではなく、複数回の実験結果が論文データに掲載されていることが多い。そこで、支援装置13では、合成プロセスの実験で使用される材料のグラム量に関しては、材料のグラム量と実験回数とを論文データから抽出し、それらの積を、合成プロセスの実験に使用された材料のグラム量として算出してもよい。また、論文データに実験回数が記載されていない場合には、グラフまたは表などにおいてプロットされている点の個数などを用いて、実験回数を推定してもよい。
【0413】
このように、組織IDごとに、論文の実験に使用される材料のグラム量の合計が算出されるため、組織ごとにどの種類の材料がどれくらいの量だけ購入されているかを把握することができる。例えば、組織Xにおいて、材料Aの合計グラム量が材料Bの合計グラム量を上回る場合は、組織Xにおいては材料Aの需要が材料Bよりも高いと解釈することができる。
【0414】
続いて、推定部122は、データテーブル145aにおいて選択された組織IDに関連付けられている全ての論文IDと著者リストとのペアを組み合わせることによって、論文著者情報を生成する。例えば、推定部122は、データテーブル145aにおいて組織ID「2」に関連付けられている全ての論文IDと著者リストとのペアを組み合わせることによって、論文著者情報{2:[2,3],3:[3]}を生成する。なお、その論文著者情報は、論文ID「2」と著者リスト[2,3]とのペアと、論文ID「3」と著者リスト[3]とのペアとを含む。
【0415】
そして、推定部122は、その選択された組織IDに対して上述のように生成された装置関連情報、プロジェクト関連情報、材料関連情報、および論文著者情報を、その組織IDに関連付ける。このような関連付けが、複数の組織IDのそれぞれに対して行われることによって、
図44に示す組織データテーブル145xが生成される。
【0416】
[推定部による推定]
推定部122は、例えば
図44に示す組織データテーブル145xを用いて、複数の組織のそれぞれの、材料の購入見込みと、材料の支払能力と、材料の利益率とを示す情報を材料推定情報として推定する。同様に、推定部122は、例えば
図44に示す組織データテーブル145xを用いて、複数の組織のそれぞれの、装置の購入見込みと、装置の支払能力とを示す情報を装置推定情報として推定する。
【0417】
材料の購入見込みは、組織が顧客として材料を購入する意思の強さを表す値である。同様に、装置の購入見込みは、組織が顧客として装置を購入する意思の強さを表す値である。
【0418】
材料の利益率は、材料1gあたりの価格と、その価格に含まれる利益との比率である。
【0419】
材料の支払能力および装置の支払能力は、組織である顧客における財政状況を表す指標である。このような支払能力が推定されることによって、材料または装置の販売会社は、顧客である組織の財政状況を把握することができる。その結果、販売会社は、材料または装置の種類を絞ることで、営業活動の効率化を図ることができる。
【0420】
図45Aは、推定部122による材料に関する推定結果の一例を示す図である。
【0421】
推定部122は、上述のように、例えば
図44に示す組織データテーブル145xを用いて、複数の組織のそれぞれの材料推定情報を推定する。
【0422】
例えば、推定部122は、組織データテーブル145xに示される複数の抽出情報を抽出する。その複数の抽出情報のそれぞれは、組織IDと、その組織IDに関連付けられている材料関連情報に含まれる材料IDとの組み合わせである。そして、推定部122は、抽出情報ごとに、その抽出情報に含まれる組織IDの組織における、その抽出情報に含まれる材料IDの材料に対する材料推定情報を推定する。例えば、
図45Aに示すように、推定部122は、組織ID「1」の組織における、材料ID「3」の材料に対する、購入見込み、支払能力、および利益率を推定する。なお、組織ID「1」および材料ID「3」の組み合わせは、抽出情報であり、推定される購入見込み、支払能力、および利益率は、材料推定情報に含まれる。
【0423】
推定部122は、材料の購入見込みの推定では、組織データテーブル145xにおいて推定対象の抽出情報に関連付けられているグラム量の合計を合計価格に換算し、その合計価格を購入見込みとして推定する。
【0424】
具体的な購入見込みの推定の一例では、推定対象の抽出情報は、組織ID「1」および材料ID「2」の組み合わせである。この場合、推定部122は、組織ID「1」において材料ID「2」の材料が使用されたグラム量の合計を、組織データテーブル145xから導出する。
図44の例では、推定部122は、グラム量の合計「0.1g」を導出する。そして、推定部122は、材料データベース142のデータテーブル142aにおいてその材料ID「2」に関連付けられている材料1gあたり価格「4000円」を参照する。推定部122は、その材料1gあたりの価格「4000円」と、導出されたグラム量の合計「0.1g」とを乗算することによって、材料ID「2」の材料の合計価格「400円」を導出する。これによって、組織ID「1」の組織における、材料ID「2」の材料に対する購入見込みとして、上述の合計価格「400円」が推定される。
【0425】
ここで、推定部122は、その合計価格である数値によって表現される購入見込みを、「小、中、高」の3つのレベルのうちの何れか1つのレベルで表現される購入見込みに変換してもよい。例えば、推定部122は、第2解析装置120のユーザによる入力部121への入力操作に応じて、その入力部121から購入見込みの第1閾値および第2閾値を取得する。そして、推定部122は、上述の合計価格が第1閾値未満であれば、その合計価格によって表現される購入見込みを、レベル「小」によって表現される購入見込みに変換する。また、推定部122は、上述の合計価格が第1閾値以上で第2閾値未満であれば、その合計価格によって表現される購入見込みを、レベル「中」によって表現される購入見込みに変換する。そして、推定部122は、上述の合計価格が第2閾値以上であれば、その合計価格によって表現される購入見込みを、レベル「大」によって表現される購入見込みに変換する。
【0426】
続いて、推定部122は、材料の支払能力の推定では、組織データテーブル145xにおいて推定対象の抽出情報に関連付けられているプロジェクト関連情報の予算規模の合計金額を、支払能力として推定する。つまり、推定部122は、推定対象の抽出情報に含まれる組織IDに関連付けられているプロジェクト関連情報の予算規模の合計金額を、支払能力として推定する。
【0427】
具体的な支払能力の推定の一例では、推定対象の抽出情報は、組織ID「1」を含む。この場合、推定部122は、組織ID「1」のプロジェクト関連情報を組織データテーブル145xから導出する。
図44の例では、推定部122は、プロジェクト関連情報{(2:20,000,000),(3:90,000,000)}を導出する。そして、推定部122は、組織ID「1」の組織における支払能力として、それらの予算規模の合計金額「1億1千万円」を推定する。
【0428】
また、推定部122は、上述と同様、その合計価格である数値によって表現される支払能力を、「小、中、高」の3つのレベルのうちの何れか1つのレベルで表現される支払能力に変換してもよい。
【0429】
続いて、推定部122は、材料の利益率の推定では、推定対象の抽出情報に含まれている材料IDの材料1gあたりの価格と、その価格に含まれる利益との比率を、利益率として推定する。利益は、材料1gあたりの価格から、材料1gあたりの原価を減算することによって得られる金額である。つまり、推定部122は、抽出情報に含まれる組織IDの組織における、その抽出情報に含まれる材料IDの材料に対する利益率を、上述の比率として推定する。具体的には、推定部122は、材料データベース142のデータテーブル142aを参照し、推定対象の抽出情報に含まれている材料IDの材料1gあたりの価格を、そのデータテーブル142aから導出する。さらに、推定部122は、第2解析装置120のユーザによる入力部121への入力操作に応じて、その材料IDの材料1gあたりの原価をその入力部121から取得する。そして、推定部122は、材料1gあたりの価格と原価との差分を、材料1gあたりの価格で除算することによって利益率を算出する。
【0430】
具体的な利益率の推定の一例では、推定対象の抽出情報は、材料ID「2」を含む。この場合、推定部122は、材料ID「2」の材料1gあたりの価格「4000円」を、材料データベース142のデータテーブル142aから導出する。さらに、推定部122は、第2解析装置120のユーザによる入力部121への入力操作に応じて、その材料IDの材料1gあたりの原価「2000円」をその入力部121から取得する。そして、推定部122は、材料1gあたりの価格「4000円」と原価「2000円」との差分「2000円」を、材料1gあたりの価格「4000円」で除算することによって利益率「0.5」を算出する。これによって、組織ID「1」の組織における、材料ID「2」の材料に対する利益率として、「0.5」が推定される。
【0431】
また、推定部122は、上述と同様、その比率によって表現される利益率を、「小、中、高」の3つのレベルのうちの何れか1つのレベルで表現される利益率に変換してもよい。
【0432】
また、推定部122は、利益率を推定する場合には、セールデータベース147に格納されているセール条件を参照し、そのセール条件に基づいて利益率を推定してもよい。例えば、推定部122は、購入見込みによって示される合計価格がセール条件を満たしていれば、材料1gあたりの価格を割引する。具体的には、推定部122は、その価格から所定の割引率(例えば10%)だけ減額する。そして、推定部122は、その割引された価格に基づいて利益率を推定する。
【0433】
推定部122は、このように推定された材料の購入見込み、支払能力および利益率を含む材料推定情報を、データベース群140に含まれる推定結果データベース148に格納する。さらに、推定部122は、その材料推定情報を例えばディスプレイなどの提示デバイスに出力し、
図45Aの例のような表形式で、材料推定情報を第2解析装置120のユーザに提示してもよい。これにより、ユーザは、この材料推定情報を参照することにより、どの組織でどの材料に対してどれだけ購入見込みがあるのかを把握することができる。さらに、ユーザは、その材料を販売した場合、どれだけの利益率が期待できるかを組織ごとに俯瞰して観察することができる。
【0434】
また、推定部122は、第2解析装置120のユーザによる入力部121への入力操作に応じて、その入力部121から材料IDを取得してもよい。この場合、推定部122は、その材料IDに関連付けられている材料推定情報のみをユーザに提示してもよい。これにより、そのユーザが属する材料販売会社によって販売される材料に関する材料推定情報のみがユーザに提示される。したがって、その材料販売会社にとって不要な情報の提示を抑えることができ、ユーザに対して必要な情報を見やすくすることができる。
【0435】
図45Bは、推定部122による材料に関する推定結果の他の例を示す図である。
【0436】
推定部122は、上述の材料の購入見込みに対して、Web検索結果を反映させてもよい。この場合、推定部122は、
図45Bに示すように、複数の抽出情報のそれぞれに対して、購入見込み、Web検索反映見込み、支払能力、および利益率を含む材料推定情報を推定する。
【0437】
例えば、推定部122は、抽出情報に含まれる組織IDの組織における購入見込みを上述のように推定すると、材料データベース142のデータテーブル142aを参照することによって、その組織が用いた材料の販売会社名を特定する。つまり、推定部122は、データテーブル142aにおいて、その抽出情報に含まれる材料IDに関連付けられている販売会社名を特定する。そして、推定部122は、その販売会社名の会社が公開するホームページの閲覧回数を取得する。推定部122は、その取得された閲覧回数を、予め定められた基準となる閲覧回数で除算することによって、閲覧比率を算出する。そして、推定部122は、上述のように合計価格によって表現される購入見込みにその閲覧比率を乗算することによって、Web検索反映見込みを算出する。なお、推定部122は、上述の購入見込みと同様、その数値によって表現されるWeb検索反映見込みを、「小、中、高」の3つのレベルのうちの何れか1つのレベルで表現されるWeb検索反映見込みに変換してもよい。
【0438】
このようなWeb検索反映見込みは、材料の販売会社のホームページの閲覧回数が反映されている。その閲覧回数には、組織である大学または研究機関などが材料を購入するためにそのホームページを閲覧した回数が含まれている。したがって、Web検索反映見込みは、そのWeb検索結果が反映されていない購入見込みよりも、精度が高い場合がある。そのため、第2解析装置120のユーザは、このWeb検索反映見込みを参照することによって、各顧客の購入見込みをより適切には把握することができる。
【0439】
図46は、推定部122による材料に関する推定結果の表示例を示す図である。
【0440】
推定部122は、例えば
図46に示すように、各組織のそれぞれの購入見込みと利益率とをグラフとしてディスプレイに表示してもよい。例えば、そのグラフの横軸は、利益率を示し、縦軸は、購入見込みを示す。そして、このようなグラフでは、A研究機関、P株式会社、T大学、W大学などのそれぞれの組織の購入見込みと利益率とが点の位置によって表現される。
【0441】
第2解析装置120のユーザは、このようなグラフを観察することにより、組織ごとのマーケティングを多元的に観察することが可能となる。例えば、
図46に示すグラフでは、T大学の購入見込がもっとも高いことを直感的に把握することが可能である。これにより、第2解析装置120のユーザが材料の販売会社に所属していれば、そのユーザは、T大学、P株式会社、W大学およびA研究機関の中で、最も営業効率が高いのはT大学ということが判断できる。
【0442】
なお、
図46の例では、推定部122は、購入見込みと利益率を示すグラフを表示するが、購入見込みと支払能力を示すグラフ、または、利益率と支払能力を示すグラフを生成して表示してもよい。また、推定部122は、
図46のような2軸のグラフではなく、購入見込と支払能力と利益率とのそれぞれを示す3軸のグラフを生成して表示してもよい。
【0443】
図47は、推定部122による材料に関する推定結果の他の例を示す図である。
【0444】
推定部122は、顧客データベース145のデータテーブル145aを用いて、
図47に示すような、処理対象の組織における処理対象の材料の購入見込みの時系列変化を導出してディスプレイに表示してもよい。例えば、推定部122は、データテーブル145aにおいて、組織ID「1」および材料ID「2」に関連付けられている、グラム量と出版月との組み合わせを少なくとも1つ特定する。なお、組織ID「1」は、上記処理対象の組織を識別するための組織IDの一例であり、材料ID「2」は、上記処理対象の材料を識別するための材料IDの一例である。
【0445】
例えば、
図43Aに示すデータテーブル145aでは、推定部122は、グラム量「0.1g」と出版月「2019年6月」との組み合わせを特定する。さらに、推定部122は、材料データベース142のデータテーブル142aを参照することによって、材料ID「2」に関連付けられている材料1gあたりの価格「4000円」を特定する。そして、推定部122は、上述のように特定されたグラム量「0.1g」と価格「4000円」とを乗算することによって、支払価格「400円」を、その組織ID「1」の組織における材料ID「2」の材料の購入見込みとして導出する。これにより、組織ID「1」の組織における材料ID「2」の材料に対する、出版月「2019年6月」での購入見込みとして、「400円」が導出される。推定部122は、このような購入見込みの導出を、上述のように特定された少なくとも1つの組み合わせのそれぞれに対して行うことによって、組織ID「1」の組織における材料ID「2」の材料の購入見込みの時系列変化を導出する。
【0446】
このように、本実施の形態では、ある組織におけるある材料の年間の購入見込の時系列変化を可視化できる。この時系列変化から購入見込の極大点を読み取ることにより、営業活動を行う時期を明確化することができる。例えば、
図47の例では、購入見込の極大点は2019年3月と、6月と、11月である。したがって、毎年、3月と、6月と11月とに営業活動を行うことがよいことがわかり、営業効率を高めることができる。
【0447】
図48は、推定部122による装置に関する推定結果の一例を示す図である。
【0448】
推定部122は、上述のように、例えば
図44に示す組織データテーブル145xを用いて、複数の組織のそれぞれの装置推定情報を推定する。
【0449】
例えば、推定部122は、組織データテーブル145xに示される複数の抽出情報を抽出する。その複数の抽出情報のそれぞれは、組織IDと、その組織IDに関連付けられている装置関連情報に含まれる装置IDとの組み合わせである。また、推定部122は、装置IDに対応する関連装置IDも抽出情報に含めてもよい。つまり、推定部122は、装置データベース141のデータテーブル141aを参照し、そのデータテーブル141aにおいて上述の装置IDに関連付けられている関連装置IDを、抽出情報に含めてもよい。
【0450】
そして、推定部122は、抽出情報ごとに、その抽出情報に含まれる組織IDの組織における、その抽出情報に含まれる装置IDの装置に対する装置推定情報を推定する。例えば、
図48に示すように、推定部122は、組織ID「1」の組織における、装置ID「1」の装置に対する、購入見込みおよび支払能力を推定する。なお、組織ID「1」および装置ID「1」の組み合わせは、抽出情報に含まれ、推定される購入見込みおよび支払能力は、装置推定情報に含まれる。
【0451】
推定部122は、装置の購入見込みの推定では、組織データテーブル145xにおいて推定対象の抽出情報に関連付けられている装置の価格の合計を、その装置の購入見込みとして推定する。
【0452】
具体的な購入見込みの推定の一例では、推定対象の抽出情報は、組織ID「1」および装置ID「1」の組み合わせを含む。この場合、推定部122は、組織ID「1」の組織において用いられた装置ID「1」の装置の価格を、組織データテーブル145xから導出する。
図44の例では、推定部122は、装置の価格「200万円」を導出する。これによって、組織ID「1」の組織における、装置ID「1」の装置に対する購入見込みとして、上述の価格「200万円」が推定される。
【0453】
また、推定部122は、上述と同様、その価格である数値によって表現される購入見込みを、「小、中、高」の3つのレベルのうちの何れか1つのレベルで表現される購入見込みに変換してもよい。
【0454】
推定部122は、装置の支払能力の推定では、組織データテーブル145xにおいて推定対象の抽出情報に関連付けられているプロジェクト関連情報の予算規模の合計金額を、支払能力として推定する。つまり、推定部122は、推定対象の抽出情報に含まれる組織IDに関連付けられているプロジェクト関連情報の予算規模の合計金額を、支払能力として推定する。この装置の支払能力は、材料の支払能力と同様に推定される。
【0455】
推定部122は、このように推定された装置の購入見込み、および装置の支払能力を含む装置推定情報を、データベース群140に含まれる推定結果データベース148に格納する。さらに、推定部122は、その装置推定情報を例えばディスプレイなどの提示デバイスに出力し、
図48の例のような表形式で、その装置推定情報を第2解析装置120のユーザに提示してもよい。これにより、ユーザは、この装置推定情報を参照することにより、どの組織でどの装置に対してどれだけ購入見込みがあるのかを把握することができる。また、ユーザは、組織ごとの購入見込を俯瞰することができ、さらに、支払能力も確認することによって、営業の成功確率を見積もることが可能になる。さらに、装置IDの関連装置IDも同時に表示される。これにより、組織の財政状況に応じて、組織が現在使用している装置の新型を案内する、または、支払能力の低い組織には装置の廉価版を案内するなどの柔軟な案内を行うことが可能となる。
【0456】
また、推定部122は、第2解析装置120のユーザによる入力部121への入力操作に応じて、その入力部121から装置IDを取得してもよい。この場合、推定部122は、その装置IDに関連付けられている装置推定情報のみをユーザに提示してもよい。これにより、そのユーザが属する装置販売会社によって販売される装置に関する装置推定情報のみがユーザに提示される。したがって、その装置販売会社にとって不要な情報の提示を抑えることができ、ユーザに対して必要な情報を見やすくすることができる。
【0457】
図49は、推定部122による装置に関する推定結果の他の例を示す図である。
【0458】
推定部122は、
図49に示すように、装置の故障率の時系列変化を推定してもよい。例えば、推定部122は、顧客データベース145のデータテーブル145aを参照し、推定対象の装置の装置IDに関連付けられている組織IDおよび出版月を特定する。例えば、推定対象の装置の装置IDが「1」であれば、推定部122は、その装置ID「1」を含む装置関連情報に関連付けられている組織IDおよび出版月を特定する。
図43Aに示すデータテーブル145aが参照される場合には、組織ID「1」および出版月「2019年6月」が特定される。
【0459】
次に、推定部122は、装置保守データベース146から、その推定対象の装置の装置IDに関連付けられている故障率曲線を取得する。この故障率曲線は、初期故障期間と、偶発故障期間と、摩耗故障期間とを示し、かつ、それらの各期間における故障率の時間変化を示す。例えば、初期故障期間は、装置の使用開始時期から3か月間であり、偶発故障期間は、初期故障期間経過後の5年間であり、摩耗故障期間は、その偶発故障期間経過後の期間である。
【0460】
推定部122は、取得された故障率曲線によって示される故障率の変化の開始月を、上述のように特定された出版月に設定する。例えば、出版月が「2019年6月」であれば、故障率の変化の開始月は「2019年6月」に設定される。これにより、推定部122は、開始月「2019年6月」から故障率が変化する故障率曲線を、装置ID「1」の装置における故障率の時系列変化として推定する。したがって、推定部122は、2019年6月から2019年9月の間が初期故障期間であり、2019年9月から2024年9月の間が偶発故障期間であり、2024年9月以降の期間が摩耗故障期間であると判断する。
【0461】
推定部122は、このように推定された装置の故障率の時系列変化を示す情報と、その装置の装置IDと、上述のように特定された組織IDとを含む故障率情報を、推定結果データベース148に格納する。また、推定部122は、故障率情報を例えばディスプレイなどの提示デバイスに出力し、
図49の例のようなグラフ形式で、第2解析装置120のユーザに、その装置の故障率の時系列変化を提示してもよい。
【0462】
これにより、第2解析装置120のユーザは、どの時期に装置のメンテナンスの案内を行うべきかを直感的に把握することができる。装置の故障率が高い初期故障期間と摩耗故障期間の間は、ユーザに対して、メンテナンスの通知をしてもよい。
【0463】
なお、学術雑誌に掲載されている科学技術論文においては、論文が投稿された日付、査読者が採録を決定した日付、雑誌等に掲載された日付が存在する。特に、権威のある雑誌等では、著者が論文を投稿してから、その論文が掲載されるまで、1年以上かかることがある。また、論文に記載されている装置は、その論文が投稿された日よりも前に購入されている。したがって、上述の出版月の代わりに、論文が投稿された日付を利用してもよい。
【0464】
また、近年は、実験結果等がインターネット上にアーカイブとして公開される場合がある。また、その実験結果と同様の内容が国際会議等で発表されることがある。そこで、国際会議等で発表された論文に関しては、インターネット上でのアーカイブを検索し、その発表された論文と同様の実験結果が公開された場合には、そのアーカイブでの日付を、上述の出版月の代わりに利用してもよい。
【0465】
また、同一著者が作成した複数の科学技術論文のそれぞれに、同一の装置の名称が出現することがある。一方で、材料の合成プロセスの実験に利用される装置は、高額であるため、複数台数を保有することがあまりない。そこで、複数の論文データから、同一の装置の名称が抽出された場合には、最も古い論文データが掲載された日付を、上述の出版月の代わりに利用してもよい。
【0466】
[処理フロー]
図50Aは、抽出部112の処理の一例を示すフローチャートである。
【0467】
抽出部112は、論文データベース130に保持されている複数の論文データから1つの論文データを選択してダウンロードする(ステップS51)。次に、抽出部112は、その論文データの論文bibからその論文データの出版月を抽出する(ステップS52)。つまり、抽出部112は、その論文データの発行日または出版日を抽出し、その発行日または出版日を含む出版月を特定する。さらに、抽出部112は、その論文データから、著者名を著者IDとして抽出し(ステップS53)、組織名を組織IDとして抽出する(ステップS54)。著者IDは、ORCIDであってもよい。また、抽出部112は、その抽出された著者名が、その抽出された組織名の組織に所属しているかを確認してもよい。例えば、抽出部112は、抽出された著者名の過去の文献を検索し、その文献のデータを参照することによって、抽出された著者名と組織名の照合を行ってもよい。
【0468】
次に、抽出部112は、論文データから、材料関連情報を抽出し(ステップS55)、プロジェクト関連情報を抽出し(ステップS56)、装置関連情報を抽出する(ステップS57)。これらの情報の抽出では、材料データベース142のデータテーブル142a、プロジェクトデータベース143のデータテーブル143a、および装置データベース141のデータテーブル141aが用いられる。そして、論文データにおいて材料情報、プロジェクト情報、および装置情報の表記揺れがあっても、抽出部112は、上記各データテーブルを参照することによって、材料関連情報、プロジェクト関連情報、および装置関連情報を適切に抽出することができる。
【0469】
そして、抽出部112は、ステップS52~S57で抽出された各情報を含むデータセットを、ステップS51で選択された論文データの論文IDに関連付けて顧客データベース145に格納する(ステップS58)。
【0470】
抽出部112は、ステップS58の後、論文データベース130に保持されている全ての論文データを選択したか否かを判定する(ステップS59)。ここで、抽出部112は、選択していないと判定すると(ステップS59のNo)、ステップS51からの処理を繰り返し実行する。一方、抽出部112は、選択したと判定すると(ステップS59のYes)、処理を終了する。
【0471】
図50Bは、推定部122の処理の一例を示すフローチャートである。
【0472】
推定部122は、顧客データベース145からデータテーブル145aを取得する(ステップS61)。次に、推定部122は、そのデータテーブル145aに含まれる各データセットを組織IDでソートすることによって、そのデータテーブル145aを組織データテーブル145xに変換する(ステップS62)。
【0473】
次に、推定部122は、その組織データテーブル145xを用いて、材料推定情報を推定し(ステップS63)、さらに、装置推定情報を推定する(ステップS64)。そして、推定部122は、装置の故障率の時系列変化を推定する(ステップS65)。
【0474】
このような本実施の形態における支援装置13では、材料研究者などが確実かつ継続的に出版する論文データという情報媒体に着目することにより、効率的に顧客情報を抽出することができる。さらに、抽出した顧客情報の解析を行うことで、材料または装置の販売会社の営業活動に有益な情報を提供することができる。
【0475】
なお、本実施の形態では、科学技術論文などの論文データが用いられるが、国家プロジェクトなどの報告書または最終報告書などが用いられてもよい。国家プロジェクトの報告書には、その成果として、購入された装置および材料の情報が記載されていることが多い。特に、その報告書では、科学技術論文とは異なり、紙面の枚数が制限されていないことが多く、多くの内容が記載されている。一方で、科学技術論文では、国際会議学術雑誌において、ページ数が制限されていることが多い。そこで、科学技術論文などの論文データにおいて、プロジェクト名称等が記載されていた場合には、そのプロジェクトの最終報告書等のテキスト情報を検索することで、その論文データの実験などのために購入された装置および材料に関する情報を収集することが可能になる。ただし、一般に、国家プロジェクトは複数年度にわたることが多いため、国家プロジェクト等の最終報告書は、その国家プロジェクトの終了年度以降に公開されることが多い。一方で、国際会議または技術雑誌に掲載される科学技術論文は、それに比べると早くに公開されることが多い。
【0476】
そこで、本実施の形態における抽出部112は、顧客データベース145の装置関連情報を、まず、公開された論文データにより構築する。そして、抽出部112は、その論文データに示される実験結果がプロジェクトの研究成果の場合には、プロジェクト終了後に公開されている報告書等を用いて、その装置関連情報を更新してもよい。
【0477】
また、本実施の形態では、論文データが用いられているが、その論文データの代わりに他のドキュメントが用いられてもよい。
【0478】
また、本実施の形態における第1解析装置110は、合成プロセス抽出部111を備えているが、合成プロセス抽出部111を備えていなくてもよい。この場合、論文データベース130に格納されている論文データは、合成プロセス以外の内容が記載されていてもよい。
【0479】
また、本実施の形態では、出版月の代わりに発行日または出版日が抽出されて顧客データベース145のデータテーブル145aに示されてもよい。
【0480】
以上、一つまたは複数の態様に係る支援装置、生成装置、および分析装置について、上記各実施の形態および変形例に基づいて説明したが、本開示は、これらの実施の形態および変形例に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を上記各実施の形態および変形例に施したものや、異なる実施の形態または異なる変形例における構成要素を組み合わせて構築される形態も、本開示の範囲内に含まれてもよい。
【0481】
例えば、上記各実施の形態および変形例では、ドキュメントは論文であるが、教科書、雑誌または特許文献などであってもよい。
【0482】
また、上記実施の形態1~3および変形例では、合成プロセス蓄積部201には、合成プロセス生成装置100によって生成された合成プロセスが蓄積されるが、その合成プロセスの生成に用いられたドキュメントも、その合成プロセスに関連付けて蓄積されてもよい。この場合には、合成プロセスまたは複合合成プロセスを表示部205に表示させることができるとともに、ユーザによる操作に応じて、それらの合成プロセスの元となるドキュメントも表示部205に表示させることができる。また、ドキュメントそのものを合成プロセス蓄積部201に蓄積する代わりに、そのドキュメントが保存されている場所を示す情報を合成プロセス蓄積部201に蓄積してもよい。その場所を示す情報は、例えば、URL(Uniform Resource Locator)またはURI(Uniform Resource Identifier)などであってもよい。
【0483】
また、上記実施の形態1~3および変形例では、複合部204は、複数の合成プロセスを複合するが、これらの合成プロセスに重みを付けて複合してもよい。例えば、複数の合成プロセスのそれぞれの書誌情報に含まれる被引用数を重み付けに用いてもよい。つまり、複合部204は、検索された複数の合成プロセスのそれぞれの被引用数を特定し、それらの合成プロセスのうち、被引用数が低い順に所定の数の合成プロセスを、複合の対象から省いてもよい。
【0484】
また、上記実施の形態1~3および変形例では、生成部107は、ドキュメントにおける出現順に複数の処理単語を関連付けるが、処理単語と他の処理単語との関係を示す辞書を用いて複数の処理単語の関連付けを行ってもよい。また、生成部107は、予め定められたルールにしたがって複数の処理単語を関連付けてもよい。
【0485】
また、上記実施の形態1~3および変形例では、生成された合成プロセスおよび複合合成プロセスがそれぞれグラフ化されて表示されるが、そのグラフ化された合成プロセスおよび複合合成プロセスはユーザによって修正されてもよい。例えば、ユーザは、表示部205に表示されている合成プロセスに誤りを見つけると、操作デバイス340を操作することによって、その誤りを修正する。つまり、生成部107は、操作デバイス340から出力される操作結果を示す信号を受け付けると、その信号に応じて、合成プロセスに含まれる複数の処理単語の配置または順番を変更したり、処理単語と合成条件との関連付けを変更したりする。
【0486】
また、ユーザは、例えば、操作デバイス340を操作することによって、表示部205に表示されている複合合成プロセスの構成を修正してもよい。つまり、複合部204は、操作デバイス340から出力される操作結果を示す信号を受け付けると、その信号に応じて、複合合成プロセスに含まれる複数の処理単語または材料単語の削除または変更を行う。このような複合合成プロセスの構成の修正が行われると、検索部203は、その修正後の複合合成プロセスに含まれる材料単語および処理単語に合致する合成プロセスを検索してもよい。すなわち、合成プロセスの再検索が行われる。複合部204は、その再検索によって見つかった複数の合成プロセスを複合することによって、新たに複合合成プロセスを生成して表示部205に表示させる。この新たな複合合成プロセスは、上述の修正後の複合合成プロセスと同一の構成(すなわち同一の材料単語および同一の処理単語)を有し、さらに、その構成に応じた適切な包括合成条件および包括特性値を含む。
【0487】
また、上記実施の形態1~3および変形例では、複合合成フローにおける材料単語、処理単語および合成条件のそれぞれの関連付けが同様の実線または矢印によって表示される。しかし、合成フローの検索結果に応じて、それらの関連付けを示す実線または矢印の態様を異ならせてもよい。例えば、
図16に示す複合合成フローにおいて、処理単語「mix」の処理に続いて処理単語「heat」の処理が行われる合成フローの数が、処理単語「heat」の処理に続いて処理単語「mill」の処理が行われる合成フローの数よりも多い場合がある。このような場合、複合部204は、処理単語「mix」から処理単語「heat」に向かう矢印の太さを、処理単語「heat」から処理単語「mill」に向かう矢印の太さよりも太くしてもよい。これにより、各ドキュメントにおける合成プロセスの傾向をより明確に把握することができる。
【0488】
また、上記実施の形態1~3および変形例では、書誌情報に、出発材料の材料単語、目的材料の材料単語、および目的材料の特性値は含まれていないが、含まれていてもよい。
【0489】
また、上記実施の形態1~3および変形例では、合成プロセス生成装置100と合成プロセス分析装置200、240および250とを備えるが、これらの装置は1つの装置に含まれていてもよく、個別の装置であってもよい。例えば、合成プロセス生成装置100と合成プロセス分析装置200、240および250とは、インターネットなどの通信ネットワークで接続されていてもよい。また、これらの装置に含まれるそれぞれ情報処理を行う複数の構成要素は、1つのプロセッサまたは回路によって構成されてもよく、複数のプロセッサまたは回路によって構成されていてもよい。
【0490】
また、上記実施の形態1~3および変形例では、合成プロセス生成装置100は、構造化データである合成プロセスを生成する。この合成プロセスの生成は、ドキュメントに自然言語で記述されている合成プロセスを、
図8に示すようなグラフ化可能な構造化データの合成プロセスに変換する処理ともいえる。なお、ドキュメントには、合成プロセスが自然言語で記述されている必要はない。例えば、ドキュメントには、表などの形式で合成プロセスが記述されていてもよい。
【0491】
また、上記実施の形態1の変形例2では、複合部204は、クラスタリングを行うが、このクラスタリングは自動で行われてもよく、ユーザによる閾値の設定によって行われてもよい。例えば、複合部204は、圧力の合成条件「300MPa」、「250MPa」、「320MPa」、「450MPa」および「460MPa」をクラスタリングする場合、ユーザによって設定された閾値として例えば「400MPa」を受け付ける。これにより、複合部204は、それらの合成条件の集合を、「300MPa」、「250MPa」および「320MPa」からなる部分集合と、「450MPa」および「460MPa」からなる部分集合とにクラスタリングする。これにより、ユーザは所望のクラスタリングを行うことができる。
【0492】
なお、上記各実施の形態および変形例において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記各実施の形態および変形例の支援装置、生成装置、および分析装置などを実現するソフトウェアプログラムは、
図17Aおよび
図17Bと、
図50Aおよび
図50Bとによって示される少なくとも1つのフローチャートに含まれる各ステップをコンピュータに実行させる。
【0493】
また、本開示は、上記各実施の形態および変形例に限定されないのはもちろんである。以下のような場合も本開示に含まれる。
【0494】
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
【0495】
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。RAMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、そのコンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
【0496】
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。そのICカードまたはモジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。そのICカードまたはモジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、そのICカードまたはモジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
【0497】
(4)本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、コンピュータプログラムからなるデジタル信号であるとしてもよい。
【0498】
また、本開示は、そのコンピュータプログラムまたはデジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標) Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されているデジタル信号であるとしてもよい。
【0499】
また、本開示は、そのコンピュータプログラムまたはデジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
【0500】
また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、そのメモリは、上述のコンピュータプログラムを記憶しており、そのマイクロプロセッサは、コンピュータプログラムにしたがって動作するとしてもよい。
【0501】
また、プログラムまたはデジタル信号を記録媒体に記録して移送することにより、またはプログラムまたはデジタル信号をネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
【産業上の利用可能性】
【0502】
本開示の支援装置、生成装置、および分析装置は、合成プロセスの探索を適切に支援することができ、材料開発または新たな材料合成を行うための装置またはシステムに有用である。
【符号の説明】
【0503】
10、11、12 合成プロセス探索支援システム(支援装置)
13 支援装置
100 合成プロセス生成装置(生成装置)
101 ドキュメント選択部
102 ドキュメント蓄積部
103 材料単語抽出部
104 処理単語抽出部
105 条件抽出部
106 特性値抽出部
107 生成部
110 第1解析装置
111 合成プロセス抽出部
112 抽出部
120 第2解析装置
121 入力部
122 推定部
130 論文データベース
140 データベース群
141 装置データベース
142 材料データベース
143 プロジェクトデータベース
144 単位辞書データベース
145 顧客データベース
145x 組織データテーブル
146 装置保守データベース
147 セールデータベース
148 推定結果データベース
200、240、250 合成プロセス分析装置(分析装置)
201 合成プロセス蓄積部
202 検索条件入力部
203 検索部
204 複合部
205 表示部
206 関連蓄積部
207 合成条件入力部
208 特性値推定部
211 設備特性蓄積部
212 設備検索部
310 コンピュータ
320 通信ネットワーク
331 第1記録媒体
332 第2記録媒体
340 操作デバイス