IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社CrowdChemの特許一覧

特開2024-179051情報処理システム、情報処理方法及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024179051
(43)【公開日】2024-12-26
(54)【発明の名称】情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
   G06F 16/903 20190101AFI20241219BHJP
   G06F 16/9536 20190101ALI20241219BHJP
【FI】
G06F16/903
G06F16/9536
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023097552
(22)【出願日】2023-06-14
(71)【出願人】
【識別番号】522039108
【氏名又は名称】株式会社CrowdChem
(74)【代理人】
【識別番号】100174137
【弁理士】
【氏名又は名称】酒谷 誠一
(72)【発明者】
【氏名】池端 久貴
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175DA06
5B175HA01
(57)【要約】      (修正有)
【課題】ユーザが使用したい用途またはユーザが望む特性を満たす化学物質を探索するのにかかる労力を低減する情報処理システム、方法及びプログラムを提供する。
【解決手段】コンピュータシステムは、ユーザによって入力された対象特性および/または対象用途を取得する取得部と、対象特性を取得した場合、取得した対象特性夫々について対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、対象用途を取得した場合、取得した対象用途夫々について対象用途向けの化学物質の特徴量を対象用途特徴量として推定するスコア推定部と、対象特性夫々について前記対象特性特徴量と化学物質夫々の特徴量との第1類似度及び/又は対象用途夫々について対象用途特徴量と化学物質夫々の特徴量との第2類似度を化学物質毎に決定し、決定した第1類似度及び/又は第2類似度を少なくとも用いて、化学物質夫々から推薦する化学物質を決定する決定部と、を備える。
【選択図】図4
【特許請求の範囲】
【請求項1】
ユーザによって入力された対象特性および/または対象用途を取得する取得部と、
前記対象特性を取得した場合、当該取得した対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、前記対象用途を取得した場合、当該取得した対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する推定部と、
対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との第1類似度、及び/または対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との第2類似度を化学物質毎に決定し、当該決定した第1類似度及び/または第2類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定する決定部と、
を備える情報処理システム。
【請求項2】
前記推定部は、化学物質と対象用途との共起度と、当該化学物質と用途との共起度と、当該特性と対象用途の共起度とを用いて、前記対象用途向けの化学物質の特徴量を推定する
請求項1に記載の情報処理システム。
【請求項3】
前記推定部は、当該対象の化学物質と他の物質との共起度と、当該他の物質と対象用途との共起度とを更に用いて、前記対象用途向けの化学物質の特徴量を推定する
請求項2に記載の情報処理システム。
【請求項4】
前記取得部がユーザによって入力された関連物質を取得した場合、前記決定部は、化学物質の種類毎に当該関連物質との類似度を決定し、当該決定した化学物質毎の類似度を更に用いて当該化学物質それぞれのうちからから推薦する化学物質を決定する
請求項1から3のいずれか一項に記載の情報処理システム。
【請求項5】
前記取得部がユーザによって入力された化学製品カテゴリを取得した場合、前記決定部は、当該化学製品カテゴリに属する化学物質について化学物質の種類毎に類似度を決定し、当該決定した化学物質毎の類似度を用いて当該化学物質それぞれのうちからから推薦する化学物質を決定する
請求項1から3のいずれか一項に記載の情報処理システム。
【請求項6】
ユーザによって入力された対象特性および/または対象用途を取得する取得ステップと、
前記対象特性を取得した場合、当該取得した対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、前記対象用途を取得した場合、当該取得した対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する推定ステップと、
対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との第1類似度、及び/または対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との第2類似度を化学物質毎に決定し、当該決定した第1類似度及び/または第2類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定する決定ステップと、
を有する情報処理方法。
【請求項7】
コンピュータに、
ユーザによって入力された対象特性および/または対象用途を取得する取得ステップと、
前記対象特性を取得した場合、当該取得した対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、前記対象用途を取得した場合、当該取得した対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する推定ステップと、
対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との第1類似度、及び/または対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との第2類似度を化学物質毎に決定し、当該決定した第1類似度及び/または第2類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定する決定ステップと、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
様々な用途(例えば非特許文献1参照)で、様々な特性を有する化学製品(または化学物質)が存在する。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】経済産業省製造産業局化学物質管理課化学物質安全室、独立行政法人製品評価技術基盤機構化学物質管理センター、「化審法に用いる化学物質用途分類表Ver.2」、平成30年8月
【非特許文献2】https://www.albert2005.co.jp/knowledge/marketing/recommendation_basics/collaborative_filtering
【非特許文献3】https://qiita.com/nozma/items/d8dafe4e938c43fb7ad1
【非特許文献4】https://devopedia.org/named-entity-recognition
【発明の概要】
【発明が解決しようとする課題】
【0004】
ユーザが使用したい用途及びユーザが望む特性を満たす化学物質を探すのに労力がかかるという問題がある。
【0005】
本発明は、上記問題に鑑みてなされたものであり、ユーザが使用したい用途及び/またはユーザが望む特性を満たす化学物質を探索するのにかかる労力を低減することを可能とする情報処理システム、情報処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る情報処理システムは、ユーザによって入力された対象特性および/または対象用途を取得する取得部と、前記対象特性を取得した場合、当該取得した対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、前記対象用途を取得した場合、当該取得した対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する推定部と、対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との第1類似度、及び/または対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との第2類似度を化学物質毎に決定し、当該決定した第1類似度及び/または第2類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定する決定部と、を備える。
【0007】
本発明の第2の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記推定部は、化学物質と対象用途との共起度と、当該化学物質と用途との共起度と、当該特性と対象用途の共起度とを用いて、前記対象用途向けの化学物質の特徴量を推定する。
【0008】
本発明の第3の態様に係る情報処理システムは、第2の態様に係る情報処理システムであって、前記推定部は、当該対象の化学物質と他の物質との共起度と、当該他の物質と対象用途との共起度とを更に用いて、前記対象用途向けの化学物質の特徴量を推定する。
【0009】
本発明の第4の態様に係る情報処理システムは、第1から3のいずれかの態様に係る情報処理システムであって、前記取得部がユーザによって入力された関連物質を取得した場合、前記決定部は、化学物質の種類毎に当該関連物質との類似度を決定し、当該決定した化学物質毎の類似度を更に用いて当該化学物質それぞれのうちからから推薦する化学物質を決定する。
【0010】
本発明の第5の態様に係る情報処理システムは、第1から3のいずれかの態様に係る情報処理システムであって、前記取得部がユーザによって入力された化学製品カテゴリを取得した場合、前記決定部は、当該化学製品カテゴリに属する化学物質について化学物質の種類毎に類似度を決定し、当該決定した化学物質毎の類似度を用いて当該化学物質それぞれのうちからから推薦する化学物質を決定する。
【0011】
本発明の第6の態様に係る情報処理方法は、ユーザによって入力された対象特性および/または対象用途を取得する取得ステップと、前記対象特性を取得した場合、当該取得した対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、前記対象用途を取得した場合、当該取得した対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する推定ステップと、対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との第1類似度、及び/または対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との第2類似度を化学物質毎に決定し、当該決定した第1類似度及び/または第2類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定する決定ステップと、を有する。
【0012】
本発明の第7の態様に係るプログラムは、コンピュータに、ユーザによって入力された対象特性および/または対象用途を取得する取得ステップと、前記対象特性を取得した場合、当該取得した対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、前記対象用途を取得した場合、当該取得した対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する推定ステップと、対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との第1類似度、及び/または対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との第2類似度を化学物質毎に決定し、当該決定した第1類似度及び/または第2類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定する決定ステップと、を実行させるためのプログラムである。
【発明の効果】
【0013】
本発明の一態様によれば、ユーザによって指定された対象用途及び/または対象特性を有する化学物質をユーザに提案することができるので、ユーザが使用したい用途及び/またはユーザが望む特性を満たす化学物質を探索するのにかかる労力を低減することができる。
【図面の簡単な説明】
【0014】
図1】本実施形態に共通する情報処理システムの概略構成図である。
図2】本実施形態に共通する端末の概略構成図である。
図3】本実施形態に共通するコンピュータシステムの概略構成図である。
図4】化学製品を推薦する画面遷移の一例である。
図5】推薦対象の化学製品が使用されている特許一覧画面の一例である。
図6】第1計算手法を説明するための表である。
図7】第2計算手法を説明するための表である。
図8】実施例1の処理の流れの一例を示すフローチャートである。
図9A】共起数を用いた計算方式の第1の手順を説明するための表である。
図9B】共起数を用いた計算方式の第2の手順を説明するための表である。
図9C】共起数を用いた計算方式の第2の手順を説明するための表である。
図10】第2の実施形態に係る化学製品を推薦するための入力画面の一例である。
図11】第2の実施形態のコンピュータシステムの概略構成図である。
図12】第2の実施形態において用途または特性のキーワードの入力に対して提案される化学製品の一例を示す表である。
図13】第2の実施形態に係る物質名の辞書の一例である。
図14】第2の実施形態に係る判定結果の一例を示す図である。
図15】第2の実施形態に係る判定結果の別の例を示す図である。
図16】物質名と用途の共起度、または物質名と特性の共起度、物質名と物質名との共起度を計算する対象文章を説明するための図である。
図17】Jaccard係数が格納されるテーブルの一例である。
図18】特性の単語のリストの一例である。
図19】評価関数の計算を説明するための図である。
図20】第2の実施形態の処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
【0016】
図1は、本実施形態に共通する情報処理システムの概略構成図である。図1に示すように、化学製品または化学物質を提案する情報処理システムSは、ユーザが使用する端末1-1、…、1-N(Nは自然数)とコンピュータシステム2とを備える。端末1-1、…、1-Nの各々は、コンピュータシステム2と通信回路網CNを介して通信可能に接続されている。端末は、例えばスマートフォン、タブレット端末、ノートパソコン、またはパソコンなどのコンピュータ等である。以下、端末1-1、…、1-Nを総称して端末1ともいう。
【0017】
図2は、本実施形態に共通する端末の概略構成図である。図2に示すように、端末1は一例として、入力インタフェース11と、通信モジュール12と、記憶装置13と、メモリ14と、出力インタフェース15と、プロセッサ16とを備える。なお、ここでは一態様として端末1は一つのプロセッサ16を備えるとして説明するが、複数あってもよく、すなわち一以上のプロセッサを備えればよい。またここでは一態様として端末1は一つの記憶装置13を備えるとして説明するが、複数あってもよく、すなわち一以上の記憶装置を備えればよい。
【0018】
入力インタフェース11は、端末1のユーザからの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ16へ出力する。通信モジュール12は、通信回路網CNに接続されており、コンピュータシステム2と通信する。この通信は有線であっても無線であってもよい。
【0019】
記憶装置13は例えばストレージであり、プロセッサ16が読み出して実行するためのプログラム及び各種のデータが格納されている。メモリ14は、データ及びプログラムを一時的に保持する。メモリ14は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
【0020】
出力インタフェース15は、外部のディスプレイ17と接続可能であり、当該ディスプレイ17へ信号を出力可能である。プロセッサ16は、記憶装置13からプログラムをメモリ14にロードし、当該プログラムに含まれる一連の命令を実行することによって各種の処理を行う。
【0021】
図3は、本実施形態に共通するコンピュータシステムの概略構成図である。図3に示すように、コンピュータシステム2は一例として、入力インタフェース21と、通信モジュール12と、記憶装置23と、メモリ24と、出力インタフェース25と、プロセッサ26とを備える。なお、ここでは一態様としてコンピュータシステム2は一つのプロセッサ26を備えるとして説明するが、複数あってもよく、すなわち一以上のプロセッサを備えればよい。またここでは一態様としてコンピュータシステム2は一つの記憶装置13を備えるとして説明するが、複数あってもよく、すなわち一以上の記憶装置を備えればよい。
【0022】
入力インタフェース21は、コンピュータシステム2の管理者(例えば、管理団体の従業員)からの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ26へ出力する。通信モジュール22は、通信回路網CNに接続されており、端末1-1、…、1-Nの各々と通信する。この通信は有線であっても無線であってもよい。
【0023】
記憶装置23は例えばストレージであり、プロセッサ26が読み出して実行するためのプログラム及び各種のデータが格納されている。メモリ24は、データ及びプログラムを一時的に保持する。メモリ24は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
【0024】
出力インタフェース25は、外部の装置と接続可能であり、当該外部の装置へ信号を出力可能である。プロセッサ26は、記憶装置23からプログラムをメモリ24にロードし、当該プログラムに含まれる一連の命令を実行することによって、取得部261、スコア決定部260、出力部264、決定部265として機能する。スコア決定部260は、複数の化学製品(または化学物質)について複数の用途の有無を表す行列を予め決められた第1計算手法に適用して、前記対象用途の用途スコアを決定すること、及び/または前記複数の化学製品(または化学物質)について複数の特性の有無を表す行列を予め決められた第2計算手法に適用して、前記対象特性の特性スコアを決定することを実行する。ここでスコア決定部260は、用途スコア部262、特性スコア部263を有する。
【0025】
図4は、化学製品を推薦する画面遷移の一例である。図4に示すように、画面G1には、ユーザが使用したい用途(または目的)を入力するためのテキストボックスB11、ユーザが望む特性のキーワード(以下、特性キーワードともいう)を入力するためのテキストボックスB12、ユーザが所望する化学製品カテゴリを選択するためのセレクトボックスB13、「この条件で検索」ボタンB14が設けられている。テキストボックスB11には複数の用途が入力されてもよいし、テキストボックスB12には複数の特性が入力されてもよい。用途、特性キーワードが入力され化学製品カテゴリが選択された状態で、「この条件で検索」ボタンB14が押された場合、画面が画面G2へ遷移する。
【0026】
画面G2には、上記で指定された条件に基づいて提案された化学製品の製品名、物質名、この製品または物質の特に重要な特性が表示されている。重要な特性は、例えば出力部264によって用途スコアに基づいて決定されていてもよく、例えば用途スコアが所定の閾値より高い特性であってもよいし、用途スコアが所定の上位順位(例えば、3位)までの用途であってもよい。
【0027】
また画面G2には、特性毎の用途スコアの棒グラフが表示されている。この棒グラフのうちの棒B21は、ユーザによって画面G1の「目的(用途)」のテキストボックスB11で入力された第1の対象用途の用途スコアを表し、この棒グラフのうちの棒B22は、ユーザによって画面G1の「目的(用途)」のテキストボックスB11で入力された第2の対象用途の用途スコアを表している。ここで、棒B21及び棒B22は、そのほかの棒とは異なる視覚態様(例えば異なる色)で表示されてもよい。これにより、ユーザによって入力された用途の用途スコアは容易に把握することができる。
なお、用途スコアと特性スコアを1つのグラフ(例えば棒グラフ)に混在させて表示させてもよい。
【0028】
また画面G2には、「カタログ機能の材料ページ」へのリンクが表示されている。これにより、このリンク先のページに遷移することにより、ユーザは対象製品についてカタログ機能を把握することができる。
【0029】
また画面G2には、化学製品(または化学物質)の関連特許として、例えば3件の特許についてそれぞれ「特許のタイトル1」、「特許のタイトル2」、「特許のタイトル3」が表示されている。「特許のタイトル1」、「特許のタイトル2」、「特許のタイトル3」には、それぞれの特許の詳細ページ(または詳細が分かるデータ、例えば特許公報または特許公開公報のPDFファイルなど)へのリンクが張られている。これにより、ユーザは関連特許の詳細を確認することができる。このように、出力情報は、前記提案する化学製品または化学物質が記載された技術文献へのリンクを含んでもよい。
また画面G2に例えば、「AX0025で特許を検索」というリンクが表示されている。このように、推薦対象の化学製品(ここでは、AX0025)が使用されている特許一覧画面(図5参照)へのリンクが表示されていてもよい。
【0030】
図5は、推薦対象の化学製品が使用されている特許一覧画面の一例である。図5には、推薦対象の化学製品の製品名「AX0025」が使用されている特許一覧画面の一例が示されている。図5には、発明の名称を入力するためのテキストボックスB31、出願人を入力するためのテキストボックスB32、出願日の範囲を入力するためのテキストボックスB33、B34、公開日の範囲を入力するためのテキストボックスB35、B36、要約中の文言(テキスト)を入力するためのテキストボックスB37、本文中の文言(テキスト)を入力するためのテキストボックスB38が示されている。これにより、発明の名称、出願人、出願日、公開日、要約中の文言(テキスト)、本文中の文言(テキスト)によって、特許一覧画面に表示される特許を絞り込むことができる。
【0031】
これを実現するために、記憶装置23には例えば、特許のデータベースが格納されており、例えば、出願番号、公開番号、特許番号、発明の名称、出願人、出願日、公開日、要約中の文言(テキスト)、本文中の文言(テキスト)、図面などが関連づけられて記憶されている。
【0032】
この場合、推薦対象の化学製品(ここでは、AX0025)が使用されている特許一覧画面(図5参照)へのリンクが選択された場合、プロセッサ26は例えば、推薦対象の化学製品の製品名(例えば「AX0025」)で本文中の文言を検索し、検索の結果ヒットして特許文献を表示するための情報を出力し、端末1へ送信してもよい。これにより、端末1に図5に示すように、推薦対象の化学製品の製品名を本文中に含む特許の一覧画面が表示される。
【0033】
図4の画面G2を表示するために、コンピュータシステム2は以下の処理を実行してもよい。
取得部261は、ユーザによって入力された対象用途及び対象特性を取得する。
用途スコア部262は、複数の化学製品について複数の用途の有無を表す行列を予め決められた第1計算手法に適用して、前記対象用途のスコアを出力する。
特性スコア部263は、前記複数の化学製品について複数の特性の有無を表す行列を予め決められた第2計算手法に適用して、前記対象特性の用途スコアを出力する。
【0034】
出力部264は、前記対象用途のスコア及び/または前記対象特性の特性スコアを用いて、提案する化学製品または化学物質を含む出力情報を出力する。具体的に例えば出力部264は、対象用途のスコアと対象特性の特性スコアを所定の演算(例えば乗算または加算)を実行し、演算後の値に基づいて化学製品または化学物質を含む出力情報を出力してもよい。具体的には例えば出力部264は、演算後の値が最も大きい化学製品または化学物質を含む出力情報を出力してもよいし、演算後の値が大きい順に化学製品または化学物質を並べるための出力情報を出力してしてもよい。
【0035】
<協調フィルタリング>
用途スコア部262は、第1の計算手法として協調フィルタリング(非特許文献2参照)を用いてもよい。また特性スコア部263は、第2の計算手法として協調フィルタリングを用いてもよい。
【0036】
<非負値行列因子分解(NMF)>
協調フィルタリングを実行するにあたり、第1計算手法及び/または前記第2計算手法は、非負値行列因子分解(Non-negative Matrix Factorization:NMF、非特許文献3参照)を含んでもよい。
例えば前記第1の計算手法は、化学製品または化学物質毎の用途の有無を表す行列を行列分解によって用途行列及び製品行列に分解し、分解後の用途行列及び製品行列を用いて、各化学製品または各化学物質における、用途毎の用途スコアを決定することを含んでもよい。具体的には例えば分解後の用途行列及び製品行列を掛け合わせても良いし、用途行列か製品行列のどちらかに重みを持たせるような調整を行ってもよい(例えば行列のそれぞれの値をx乗、y乗してもよい)。用途毎の用途スコアは例えば、分解後の用途行列及び製品行列を掛け合わせた後に生成される行列のそれぞれの要素(セル)中の値である。この場合、出力部264は、各化学製品または各化学物質における、用途毎の用途スコア及び/または対象用途のスコアを出力してもよい。これにより例えば、図4の画面G2に示すように、用途毎の用途スコアが棒グラフで表示される。
【0037】
また例えば前記第2の計算手法は、化学製品または化学物質毎の特性の有無を表す行列を行列分解によって特性行列及び製品行列に分解し、分解後の特性行列及び製品行列を用いて、各化学製品または各化学物質における、特性毎の特性スコアを決定することを含んでもよい。具体的には例えば分解後の特性行列及び製品行列を掛け合わせても良いし、特性行列か製品行列のどちらかに重みを持たせるような調整を行ってもよい(例えば行列のそれぞれの値をx乗、y乗してもよい)。特性毎の特性スコアは例えば、分解後の特性行列及び製品行列を掛け合わせた後に生成される行列のそれぞれの要素(セル)中の値である。この場合、出力部264は、各化学製品または各化学物質における、特性毎の特性スコア及び/または対象特性のスコアを出力してもよい。
【0038】
図6は、第1計算手法を説明するための表である。図6に示すように、物質1~N(Nは自然数)それぞれについて、例えば用途1~Nがある場合に1ない場合に0で示されている。この用途は例えば、技術文献(具体的には例えば特許文献)から抽出された用途である。
【0039】
図7は、第2計算手法を説明するための表である。図7に示すように、物質1~N(Nは自然数)それぞれについて、例えば特性1~M(Mは自然数)がある場合に1ない場合に0で示されている。この特性は例えば、技術文献(具体的には例えば特許文献)から抽出された用途である。
【0040】
図8は、実施例1の処理の流れの一例を示すフローチャートである。
(ステップS110)端末1のプロセッサ16は、ユーザによって入力された対象用途及び対象特性を受け付ける。
(ステップS120)次に端末1のプロセッサ16は、受け付けた対象用途及び対象特性をコンピュータシステム2へ送信する。
【0041】
(ステップS210)次に用途スコア部262は複数の化学製品について、対象用途の用途スコアを決定する。
【0042】
(ステップS220)次に特性スコア部263は複数の化学製品について、対象特性の特性スコアを決定する。
【0043】
(ステップS230)次に出力部264は、提案する化学製品を含む出力情報を出力する。
【0044】
(ステップS240)次に出力部264は、出力情報を端末1へ送信する。
【0045】
(ステップS120)端末1は、出力情報を受信し、受信した出力情報を用いて提案する化学製品を表示する。
【0046】
<実施例2>
一方、図9A図9Cを用いて、共起数を用いた計算方式について説明する。図9Aは、共起数を用いた計算方式の第1の手順を説明するための表である。図9Bは、共起数を用いた計算方式の第2の手順を説明するための表である。図9Cは、共起数を用いた計算方式の第2の手順を説明するための表である。
前提として、記憶装置23には例えば、技術文献(ここでは一例として特許文献)の内容を含むテキストデータが実施例データベースとして格納されているものとする。
【0047】
まず、決定部265は例えばこの実施例データベースを用いて、各特許文献中において化学物質i(iは自然数、単に物質ともいう)が適用できる用途を抽出して、抽出できた用途j(jは自然数)毎に計数(すなわちカウント)することによって、共起数行列を作成する。ここで、共起数行列は、化学物質iと用途jの間の共起回数を要素とする行列である。これにより、図9Aに示すように、共起数行列を表す表T1が生成される。表T1には、縦方向に用途が並んでおり、横方向に物質が並んでおり、一つの特許文献中において化学物質i(iは自然数)が適用できる用途が記載されている場合に、その化学物質iとその用途の組について1増加するように計数された数が示されている。
【0048】
次に、決定部265は例えば作成された共起数行列を、各物質で例えば1で正規化する。これにより、図9Bに示すように、正規化された共起数行列を表す表T2が生成される。例えば、物質1の場合、フィルタ用途が5、マスク用途が15、素子用途が5であるので、25(=5+15+5)で割ることにより、フィルタ用途が0.2、マスク用途が0.6、素子用途が0.2となる。
【0049】
次に、決定部265は例えば各物質間の類似度(例えばcos類似度など)を表す類似度行列を作成する。これにより、図9Cに示すように、類似度行列を表す表T3が生成される。
【0050】
決定部265は例えば類似度に基づいて、代替物質として推薦する化学物質(または化学製品)を決定してもよい。具体的には例えば決定部265は、類似度が閾値より高い化学物質を代替物質として決定してもよいし、類似度が最も高い化学物質を代替物質として決定してもよいし、類似度が上位K番目(Kは自然数)までの化学物質を代替物質として決定してもよい。
【0051】
このように、決定部265は、技術文献中のテキストを用いて用途と化学物質の共起数、集合同士の類似度(例えばJaccard係数)、ベクトル同士の類似度(例えばピアソンの相関係数)を生成し、当該共起数、集合同士の類似度(例えばJaccard係数)、ベクトル同士の類似度(例えばピアソンの相関係数)を用いて各化学物質間の類似度を決定し、当該類似度に基づいて代替物質として推薦する化学物質を決定してもよい。ここで、集合同士の類似度は、Jaccard係数だけでなくDice係数、Simpson係数であってもよい。ベクトル同士の類似度は、ピアソンの相関係数だけでなくコサイン類似度、偏差パターン類似度であってもよい。
【0052】
そして出力部264は、この推薦する化学物質(または化学製品)を含む情報を出力してもよい。これにより、用途の類似性が高い化学物質をユーザに提案することができるので、同じような用途に使用される代替物質を把握することができる。
【0053】
なお、決定部265は、共起数行列に基づいて、同じ物質が使用される別の用途(例えば類似の用途)を出力してもよい。これにより、同じ物質が使用される別の用途(例えば類似の用途)を把握することができる。
【0054】
なお、決定部265は、技術文献中のテキストを用いて特性と化学物質の共起数、Jaccard係数、ピアソンの相関係数を生成し、当該共起数、Jaccard係数、ピアソンの相関係数を用いて各化学物質間の類似度を決定し、当該類似度に基づいて代替物質として推薦する化学物質を決定してもよい。
【0055】
そして出力部264は、この推薦する化学物質(または化学製品)を含む情報を出力してもよい。これにより、特性の類似性が高い化学物質をユーザに提案することができるので、類似の特性の代替物質を把握することができる。
【0056】
なお、決定部265は、共起数行列に基づいて、同じ物質が有する別の特性を出力してもよい。これにより、同じ物質が有する別の特性を把握することができる。
【0057】
以上、本実施形態に係る情報処理システムSは、ユーザによって入力された対象用途及び/または対象特性を取得する取得部261と、複数の化学製品について複数の用途の有無を表す行列を予め決められた第1計算手法に適用して、前記対象用途の用途スコアを決定すること、及び/または前記複数の化学製品について複数の特性の有無を表す行列を予め決められた第2計算手法に適用して、前記対象特性の特性スコアを決定することを実行するスコア決定部260と、前記対象用途のスコア及び/または前記対象特性のスコアを用いて、提案する化学製品または化学物質を含む出力情報を出力する出力部264と、を備える。
【0058】
この構成により、ユーザによって指定された対象用途及び/または対象特性を有する化学製品及び化学物質をユーザに提案することができるので、ユーザが使用したい用途及び/またはユーザが望む特性を満たす化学製品または化学物質を探索するのにかかる労力を低減することができる。
【0059】
また本実施形態に係る情報処理システムSは、ユーザによって入力された対象用途または対象特性を取得する取得部と、技術文献中のテキストを用いて用途と化学物質の集合の類似度(例えば共起数、Jaccard係数、ピアソンの相関係数)または特性と化学物質の集合の類似度(例えば共起数、Jaccard係数、ピアソンの相関係数)を生成し、当該集合の類似度(例えば共起数、Jaccard係数、ピアソンの相関係数)を用いて各化学物質間の類似度を決定し、当該類似度に基づいて代替物質として推薦する化学物質を決定する決定部と、を備える。
【0060】
この構成により、ユーザによって指定された対象用途または対象特性を有する代替物質が提案することができるので、ユーザが使用したい用途及び/またはユーザが望む特性を満たす化学製品または化学物質を探索するのにかかる労力を低減することができる。
【0061】
本実施形態の第1の態様に係る情報処理システムは、ユーザによって入力された対象用途及び/または対象特性を取得する取得部と、複数の化学製品について複数の用途の有無を表す行列を予め決められた第1計算手法に適用して、前記対象用途の用途スコアを決定すること、及び/または前記複数の化学製品について複数の特性の有無を表す行列を予め決められた第2計算手法に適用して、前記対象特性の特性スコアを決定することを実行するスコア決定部と、前記対象用途のスコア及び/または前記対象特性のスコアを用いて、提案する化学製品または化学物質を含む出力情報を出力する出力部と、を備える。
【0062】
この構成によれば、ユーザによって指定された対象用途及び/または対象特性を有する化学製品及び化学物質をユーザに提案することができるので、ユーザが使用したい用途及び/またはユーザが望む特性を満たす化学製品または化学物質を探索するのにかかる労力を低減することができる。
【0063】
本実施形態の第2の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記第1計算手法及び/または前記第2計算手法は、非負値行列因子分解 を含む。
【0064】
本実施形態の第3の態様に係る情報処理システムは、第2の態様に係る情報処理システムであって、前記第1の計算手法は、化学製品または化学物質毎の用途の有無を表す行列を行列分解によって用途行列及び製品行列に分解し、分解後の用途行列及び製品行列を掛け合わせることによって、各化学製品または各化学物質における、用途毎の用途スコアを決定することを含み、前記出力部は、各化学製品または各化学物質における、用途毎の用途スコア及び/または対象用途のスコアを出力する。
【0065】
この構成によれば、提案する化学製品または化学物質について、ユーザは各化学製品または各化学物質における、用途毎の用途スコア及び/または対象用途のスコアを確認することができる。
【0066】
本実施形態の第4の態様に係る情報処理システムは、第2の態様に係る情報処理システムであって、前記第2の計算手法は、化学製品または化学物質毎の特性の有無を表す行列を行列分解によって特性行列及び製品行列に分解し、分解後の特性行列及び製品行列を用いて、各化学製品または各化学物質における、特性毎の特性スコアを決定することを含み、前記出力部は、各化学製品または各化学物質における、特性毎のスコア及び/または前記対象特性のスコアを出力する。
【0067】
この構成によれば、提案する化学製品または化学物質について、ユーザは物質毎の特性スコア及び/または前記対象特性のスコアを把握することができる。
【0068】
本実施形態の第5の態様に係る情報処理システムは、第1から4のいずれかの態様に係る情報処理システムであって、前記出力情報は、前記提案する化学製品または化学物質が記載された技術文献へのリンクを含む。
【0069】
この構成によれば、提案する化学製品または化学物質の詳細を確認することができる。
【0070】
本実施形態の第6の態様に係る情報処理システムは、ユーザによって入力された対象用途または対象特性を取得する取得部と、技術文献中のテキストを用いて用途と化学物質の集合の類似度(例えば共起数、Jaccard係数、ピアソンの相関係数)または特性と化学物質の集合の類似度(例えば共起数、Jaccard係数、ピアソンの相関係数)を生成し、当該集合の類似度(例えば共起数、Jaccard係数、ピアソンの相関係数)を用いて各化学物質間の類似度を決定し、当該類似度に基づいて代替物質として推薦する化学物質を決定する決定部と、を備える。
【0071】
この構成によれば、ユーザによって指定された対象用途または対象特性を有する代替物質が提案することができるので、ユーザが使用したい用途及び/またはユーザが望む特性を満たす化学製品または化学物質を探索するのにかかる労力を低減することができる。また決定部は、代替物質として推薦する化学物質の用途(例えば主用途)を更に出力するようにしてもよい。これにより、代替物質として推薦する化学物質の用途(例えば主用途)を容易に把握することができる。
【0072】
本実施形態の第7の態様に係る情報処理方法は、ユーザによって入力された対象用途及び/または対象特性を取得する取得手順と、複数の化学製品について複数の用途の有無を表す行列を予め決められた第1計算手法に適用して、前記対象用途の用途スコアを決定すること、及び/または前記複数の化学製品について複数の特性の有無を表す行列を予め決められた第2計算手法に適用して、前記対象特性の特性スコアを決定することを実行するスコア出力手順と、前記対象用途のスコア及び/または前記対象特性のスコアを用いて、提案する化学製品または化学物質を含む出力情報を出力する出力手順と、を有する。
【0073】
本実施形態の第8の態様に係る情報処理方法は、ユーザによって入力された対象用途または対象特性を取得する取得手順と、技術文献中のテキストを用いて用途と化学物質の共起数行列または特性と化学物質の共起数行列を生成し、共起数行列を用いて各化学物質間の類似度を決定し、当該類似度に基づいて代替物質として推薦する化学物質を決定する決定手順と、を有する。
【0074】
本実施形態の第9の態様に係るプログラムは、コンピュータに、ユーザによって入力された対象用途及び/または対象特性を取得する取得手順、複数の化学製品について複数の用途の有無を表す行列を予め決められた第1計算手法に適用して、前記対象用途の用途スコアを決定すること、及び/または前記複数の化学製品について複数の特性の有無を表す行列を予め決められた第2計算手法に適用して、前記対象特性の特性スコアを決定することを実行するスコア決定手順、前記対象用途のスコア及び/または前記対象特性のスコアを用いて、提案する化学製品または化学物質を含む出力情報を出力する出力手順、を実行させるためのプログラムである。
【0075】
本実施形態の第10の態様に係るプログラムは、コンピュータに、ユーザによって入力された対象用途または対象特性を取得する取得手順、技術文献中のテキストを用いて用途と化学物質の共起数行列または特性と化学物質の共起数行列を生成し、共起数行列を用いて各化学物質間の類似度を決定し、当該類似度に基づいて代替物質として推薦する化学物質を決定する決定手順、を実行させるためのプログラムである。
【0076】
<第2の実施形態>
続いて第2の実施形態について説明する。第1の実施形態とは物質名(商品名)の推薦方法のロジックが異なっている。以下、化学物質を単に物質ということもある。
図10は、第2の実施形態に係る化学製品を推薦するための入力画面の一例である。図4の画面G1に比べて、図10の画面G1bでは、推薦される化学製品との間で関連性のある「関連物質」を入力するテキストボックスB15が設けられている。このテキストボックスB15への入力はオプションであり必須ではない。推薦される化学製品は、「関連物質」に入力された物質が添加されるか、または「関連物質」との代替物かなどである。例えば「関連物質」としてエポキシが入力された場合には、検索の結果、推薦される化学製品(または化学物質)は、エポキシが添加されるか、エポキシの代替物かなどである。
【0077】
化学製品カテゴリのセレクトボックスB13による選択はオプションであり必須ではない。このセレクトボックスB13によって化学製品カテゴリ(または物質カテゴリ)が選択することによって、推薦される化学製品のカテゴリを絞ることができる。「この条件で検索」ボタンB14が押された場合、画面が図4の画面G2へ遷移する。この際に、コンピュータシステム2の取得部261は、ユーザによって入力された対象用途及び/または対象特性を取得する。またセレクトボックスB13が選択されている場合、取得部261は、ユーザによって入力された化学製品カテゴリを取得する。またテキストボックスB15が入力されている場合、取得部261は、ユーザによって入力された関連物質を取得する。
【0078】
図11は、第2の実施形態のコンピュータシステムの概略構成図である。図3の第1の実施形態に比べて、プロセッサ26は、プログラムを読み出し実行することにより、取得部261、出力部264の他に、スコア決定部260、決定部265の代わりに判定部266、算出部267、推定部268、決定部269として機能する。
【0079】
図12は、第2の実施形態において用途または特性のキーワードの入力に対して提案される化学製品の一例を示す表である。
入力される用途または特性のキーワードがテーブルT1の場合、それぞれのキーワードに対して提案される化学製品(または化学物質)がテーブルT2に示されている。例えば、「耐光性 難燃」という特性のキーワードが入力された場合には、「液晶ホスファゼン:FP-390」、「環状シアノフェノキシホスファゼン」、「環状フェノキシホスファゼン」、「フェノキシクロシホスファゼン」の4つの化学製品(または化学物質)が提案される。ここでは、提案される化学製品(または化学物質)を一例として4種類としているが、1~3種類であってもよいし、5種類以上であってもよい。
【0080】
図13は、第2の実施形態に係る物質名の辞書の一例である。図12の物質名の辞書が例えばコンピュータシステム2の記憶装置23に格納されていてもよい。図12の物質名の辞書には一例として、物質名、当該物質名の商品を識別する商品コード、当該物質名の物質をSMILES(simplified molecular input line entry system)記法で表されたSMILES文字列の組が複数格納されている。なお、SMILES文字列以外の情報がであってもよく、例えばSMILESで表現できない製品固有の物性値であってもよいし、高分子の場合、分子量であってもよいし、更には製品の説明文であってもよい。これらを特徴量として数値列に変換できればよい。
【0081】
図14は、第2の実施形態に係る判定結果の一例を示す図である。図15は、第2の実施形態に係る判定結果の別の例を示す図である。化学物質の物質名と用途または特性に該当する単語との共起度(例えば、Jaccard係数)を算出するために、事前に一例として判定部266は技術文献(例えば特許文献)中の文に含まれる単語(またはフレーズ)それぞれについて、用途か特性(性質)かを区別せずに用途か特性(性質)に該当する単語か否か、及び物質名に該当するか否か判定する。用途か特性(性質)に該当するかの判定方法としては、まず機械学習モデルの学習フェーズにおいては、人手で単語を用途か特性(性質)に該当する単語を抽出し、単語のデータを入力とし用途か特性に該当すれば1それ以外であれば0とするデータを出力とする学習用データを用いて機械学習モデルを学習してもよい。その場合において、判定部266は例えば技術文献(例えば特許文献)中の文から形態素解析によって単語を抽出し、抽出した単語を学習後の機械学習モデルに入力すると、その単語が用途か特性(性質)である確率が出力されるので、その確率が閾値を超えれば用途か特性(性質)に該当するものとして出力してもよい。別の方法として、判定部266はNamed-entity recognition(NER)の技術(非特許文献4参照)を用いて、形態素解析によって抽出した単語が用途か特性(性質)に該当するか否か判定してもよい。また別の方法として予め人手によって作成された用途か特性に該当する単語のリストである用途特性リストをコンピュータシステム2の記憶装置23に格納しておき、判定部266は形態素解析によって抽出した単語をその用途特性リストと照合して、形態素解析によって抽出した単語が用途か特性(性質)に該当するか否か判定してもよい。
一方、物質名に該当するか否かの判定方法としては、物質名の単語のリストである物質名リストをコンピュータシステム2の記憶装置23に格納しておき、判定部266は形態素解析によって抽出した単語をその物質名リストと照合して、形態素解析によって抽出した単語が物質名に該当するか否か判定してもよい。
【0082】
なお、判定部266は用途か特性(性質)かを区別して判定してもよい。その場合、判定の結果、例えば、図14に示すように単語(またはフレーズ)毎に、判定結果、用途名称が得られる。一方、判定部266による判定の結果、例えば、図15に示すように単語(またはフレーズ)毎に、判定結果、特性名が得られる。
【0083】
図16は、物質名と用途の共起度、または物質名と特性の共起度、物質名と物質名との共起度を計算する対象文章を説明するための図である。図16のテーブルT21はコンピュータシステム2の記憶装置23に予め格納されていてもよい。図16のテーブルT21には特許文献を識別するID、出願人名、発明名称、その特許文献のPDFファイルへのリンク、文の組が複数格納されている。文中に対象の単語(例えば、物質名、用途または特性)があるか否かの判定部266による判定は例えば、上記用途特性リストまたは上記物質名リストにある単語との完全一致ではなく、ジャロウィンクラー類似度で閾値を設定した上で実施される。なお、ここではジャロウィンクラー類似度で閾値を設定するとしたが、ジャロウィンクラー類似度に限らず、他の類似度であってもよく、例えばハミング距離でもよい。
【0084】
図17は、Jaccard係数が格納されるテーブルの一例である。図17のテーブルT22はコンピュータシステム2の記憶装置23に格納されていてもよい。図17のテーブルT22には、ID、特性または用途の単語、物質名、当該単語と物質名とが所定の範囲の文章(例えば、1文、3文または1段落など)中で共起する強さを表すJaccard係数、当該物質名の物質のSMILES文字列の組が複数格納されている。ここで単語Cと単語DのJaccard係数は、所定の範囲の文章中で単語Cと単語Dの両方が出現する数/((所定の範囲の文章中で単語Cの出現する数+所定の範囲の文章中で単語Dの出現する数)-所定の範囲の文章中で単語Cと単語Dの両方が出現する数)で表される。
【0085】
例えば算出部267は、このJaccard係数を、特性または用途の単語と物質名の組ごとに算出し、算出結果を記憶装置23に格納してもよい。これにより、テーブルT22のデータが記憶装置23に格納される。
【0086】
図18は、特性の単語のリストの一例である。例えば特性の単語としては図18のような単語リスト中に含まれる単語である。
化学物質について推定部268は例えば、化学物質それぞれのSMILES文字列を特徴量(例えば多次元ベクトル)に変換する。これによって化学物質それぞれの特徴量が生成される。この化学物質それぞれの特徴量は事前に生成され、事前に記憶装置23に格納されていてもよい。
推定部268は例えば、対象特性(例えば光沢など)を有する化学物質の特徴量または対象用途向けの化学物質の特徴量を以下の数式に従って推定する。
【0087】
sum(各共起する化学物質の特徴量×各Jaccard係数)/sum(Jaccard係数)
【0088】
ここでsumはカッコ内の総和を表す。ここでいう化学物質の特徴量というのは、化学物質自体の特徴量ではなく、ある物質と関連のある物質の特徴量という意味となる。その意味は例えば、一緒に使われやすいとか、代替物などである。
【0089】
推定部268は、取得部261がユーザによって入力された対象特性を取得した場合、対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定する。その場合、決定部269は例えば、対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との類似度(以下、第1類似度ともいう、例えばコサイン類似度)を決定し、当該決定した化学物質毎の類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定してもよい。具体的には例えば決定部269はコサイン類似度が閾値以上の物質を推薦する物質として決定してもよいし、決定部269はコサイン類似度が高いものからN個(Nは自然数)の物質を推薦する物質として決定してもよい。
【0090】
図19は、評価関数の計算を説明するための図である。図19では説明の簡略化のため、物質A、物質B、エポキシという化学物質、光沢、難燃という特性、接着剤という用途について2次元ベクトルで表されている。
具体的に例えば光沢という特性かつ難燃という特性を達成するものは、決定部269は例えば、化学物質の種類毎(ここでは例えば物質A、物質Bそれぞれ毎)に、以下のような類似度の積を評価関数として算出し、物質毎の算出結果に基づいて、これらの化学物質のうちから推薦する化学物質を決定してもよい。
【0091】
評価関数=cos(光沢の特徴量ベクトル, 化学物質の特徴量ベクトル)×cos(難燃の特徴量ベクトル, 化学物質の特徴量ベクトル)
【0092】
ここでcos(a, b)はaベクトルとbベクトルのコサイン類似度を表す。
【0093】
また例えば光沢という特性かつ難燃という特性を達成し、エポキシと関連(例えば添加するか、代替物かなど)している可能性の高いものについては、決定部269は例えば、化学物質の種類毎(ここでは例えば物質A、物質Bそれぞれ毎)に、以下のような類似度の積を評価関数として算出し、物質毎の算出結果に基づいて、これらの化学物質のうちから推薦する化学物質を決定してもよい。
【0094】
評価関数=cos(光沢の特徴量ベクトル, 化学物質の特徴量ベクトル)×cos(難燃の特徴量ベクトル, 化学物質の特徴量ベクトル)×cos(エポキシの特徴量ベクトル, 化学物質の特徴量ベクトル)
【0095】
なお、ここでは一例として評価関数はコサイン類似度の積で表されているが、これに限らず、コサイン類似度の和(加算)であってもよい。
このように、取得部261がユーザによって入力された関連物質(例えばエポキシ)を取得した場合、決定部269は例えば、化学物質の種類毎に当該関連物質との類似度を決定し、当該決定した化学物質毎の類似度を更に用いて当該化学物質それぞれのうちからから推薦する化学物質を決定してもよい。
【0096】
一方、推定部268は、取得部261がユーザによって入力された対象用途を取得した場合、対象用途を取得した場合、対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する。その場合、決定部269は例えば、対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との類似度(以下、第2類似度ともいう)を決定し、当該決定した化学物質毎の類似度(例えば特徴量ベクトル間のコサイン類似度)を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定するしてもよい。具体的には例えば決定部269はコサイン類似度が閾値以上の物質を推薦する物質として決定してもよいし、決定部269はコサイン類似度が高いものからN個(Nは自然数)の物質を推薦する物質として決定してもよい。
【0097】
具体的には例えば接着剤という用途を達成する化学物質は、決定部269は例えば、化学物質の種類毎(ここでは例えば物質A、物質Bそれぞれ毎)に、以下のような類似度を評価関数として算出し、物質毎の算出結果に基づいて、これらの化学物質のうちから推薦する化学物質を決定してもよい。
【0098】
評価関数=cos(接着剤の特徴量ベクトル, 化学物質の特徴量ベクトル)
【0099】
また例えば接着剤という用途を達成し、エポキシと関連(例えば添加したりとか、代替物か、など)している可能性の高いものについては、決定部269は例えば、化学物質の種類毎(ここでは例えば物質A、物質Bそれぞれ毎)に、以下のような類似度の積を評価関数として算出し、物質毎の算出結果に基づいて、これらの化学物質のうちから推薦する化学物質を決定してもよい。
【0100】
評価関数=cos(接着剤の特徴量ベクトル, 化学物質の特徴量ベクトル)×cos(エポキシの特徴量ベクトル, 化学物質の特徴量ベクトル)
【0101】
なお、ここでは一例として評価関数はコサイン類似度の積で表されているが、これに限らず、コサイン類似度の和(加算)であってもよい。このように、取得部261がユーザによって入力された関連物質(例えばエポキシ)を取得した場合、決定部269は例えば、化学物質の種類毎に当該関連物質との類似度を決定し、当該決定した化学物質毎の類似度を更に用いて当該化学物質それぞれのうちからから推薦する化学物質を決定してもよい。
【0102】
なお、ユーザによって化学製品カテゴリが入力された場合には、決定部269は、当該化学製品カテゴリに属する化学物質について化学物質の種類毎(ここでは例えば物質A、物質Bそれぞれ毎)に、類似度を決定し、当該決定した化学物質毎の類似度を用いて(例えば類似度の積を評価関数として算出し、質毎の算出結果に基づいて)、当該化学物質それぞれのうちからから推薦する化学物質を決定してもよい。
【0103】
なお、用途と化学物質の共起が比較的少ない場合がある。これに対して、決定部269は例えば、特性と用途の共起度(例えばJaccard係数)を利用して、用途と化学物質の共起度を対象用途特徴量として算出してもよい。物質Aと用途Xの共起度は例えば以下の式(1)で表される。
【0104】
共起度(物質A, 用途X) = Jaccard(物質A, 用途X) +α×sum(Jaccard(物質A, 特性)*Jaccard(特性, 用途X)) …(1)
【0105】
ここでαは重み係数であり、Jaccardはカッコ内の2つの単語の共起の強さを表すJaccard係数を表し、sumはカッコ内の総和を表す。このように上記式の右辺の第2項が追加されてもよい。
【0106】
このように用途X向けの化学物質の特徴量は例えば化学物質と用途Xの共起度であり、この共起度は、化学物質と対象用途との共起度(例えばJaccard(物質A, 用途X))と、当該化学物質と用途との共起度(例えばJaccard(物質A, 特性))と、当該特性と対象用途の共起度(例えばJaccard(特性, 用途X))を用いて推定部268によって推定されていてもよい。
【0107】
例えば、添加剤で特定の樹脂と組み合わせる際に効果がでるものは、上記だと表現できない場合がある。その場合には用途X向けの化学物質の特徴量は、以下の式(2)に従って物質Aと用途Xとの共起度として、推定部268によって推定されてもよい。式(2)は式(1)に比べて右辺の第3項が追加されたものである。
【0108】
共起度(物質A, 用途X) = Jaccard(物質A, 用途X) +α×sum(Jaccard(物質A, 特性) ×Jaccard(特性, 用途X))+β*sum(Jaccard(物質A, 物質)×Jaccard(物質, 用途X)) …(2)
【0109】
ここでsum(Jaccard(物質A, 特性)*Jaccard(特性, 用途X))は、特性それぞれについて、化学物質Aと当該特性との間のJaccard係数に当該特性と用途Xとの間のJaccard係数をかけたものの総和である。sum(Jaccard(物質A, 物質)*Jaccard(物質, 用途X))は、物質それぞれについて化学物質Aとの間のJaccard係数に当該物質と用途Xとの間のJaccard係数をかけたものの総和である。
【0110】
このように対象用途(用途X)向けの化学物質の特徴量は例えば、対象の化学物質(物質A)と対象用途(用途X)の共起度であり、この共起度は、対象の化学物質と対象用途との共起度(例えばJaccard(物質A, 用途X))と、当該対象の化学物質と特性との共起度(例えばJaccard(物質A, 特性))と、当該対象の化学物質と他の物質との共起度(例えばJaccard(物質A, 物質))と、当該他の物質と対象用途との共起度(例えばJaccard(物質, 用途X))とを用いて推定部268によって推定されていてもよい。
【0111】
式(2)は式(1)に比べて右辺の第3項が追加されたものに鑑みると、推定部268が、当該対象の化学物質と他の物質との共起度(例えばJaccard(物質A, 物質))と、当該他の物質と対象用途との共起度(例えばJaccard(物質, 用途X))とを更に用いて、対象用途(例えば用途X)向けの化学物質の特徴量を推定してもよいということを意味する。
【0112】
図20は、第2の実施形態の処理の流れの一例を示すフローチャートである。前提として、コンピュータシステム2bの推定部268によって、化学物質それぞれの特徴量が事前に決定されており、事前に記憶装置23に格納されているものとして説明する。
【0113】
(ステップS310)端末1のプロセッサ16は、ユーザによって入力された対象用途及び/または対象特性を受け付ける。
(ステップS320)次に端末1のプロセッサ16は、受け付けた対象用途及び/または対象特性をコンピュータシステム2bへ送信する。
【0114】
(ステップS410)次に推定部268は取得部261が対象特性を取得したか否か判定する。
【0115】
(ステップS420)取得部261が対象特性を取得した場合(ステップS410 YES)、推定部268は対象特性それぞれについて対象特性特徴量を推定する。
【0116】
(ステップS430)次に推定部268は取得部261が対象用途を取得したか否か判定する。
【0117】
(ステップS440)取得部261が対象特性を取得した場合(ステップS430 YES)、推定部268は対象用途それぞれについて対象用途特徴量を推定する。
【0118】
(ステップS450)次に決定部269は、対象特性特徴量と化学物質の特徴量との類似度、及び/または対象用途特徴量と化学物質の特徴量との類似度を用いて、化学物質毎に評価関数を決定し、当該化学物質毎の評価関数を用いて当該化学物質それぞれのうちから推薦する化学物質(例えば化学物質の名称)を決定する。
【0119】
(ステップS460)次に出力部264は、推薦する化学物質の名称を含む出力情報を端末1へ送信する。
【0120】
(ステップS330)端末1は、出力情報を受信し、受信した出力情報を用いて提案する化学物質の名称を表示する。
なお、上記フローチャートでは特性と用途を分けて処理したが、これに限らず、特性と用途を混在させて同列に扱って処理してもよい。
【0121】
以上、第2の実施形態に係る情報処理システムSは、ユーザによって入力された対象特性および/または対象用途を取得する取得部261を備える。
情報処理システムSは、前記対象特性を取得した場合、当該取得した対象特性それぞれについて当該対象特性を有する化学物質の特徴量を対象特性特徴量として推定し、前記対象用途を取得した場合、当該取得した対象用途それぞれについて当該対象用途向けの化学物質の特徴量を対象用途特徴量として推定する推定部268を備える。
情報処理システムSは、対象特性それぞれについて前記対象特性特徴量と化学物質それぞれの特徴量との第1類似度、及び/または対象用途それぞれについて前記対象用途特徴量と化学物質それぞれの特徴量との第2類似度を化学物質毎に決定し、当該決定した第1類似度及び/または第2類似度を少なくとも用いて、当該化学物質それぞれから推薦する化学物質を決定する決定部269を備える。
この構成によれば、ユーザによって指定された対象用途及び/または対象特性を有する化学物質をユーザに提案することができるので、ユーザが使用したい用途及び/またはユーザが望む特性を満たす化学物質を探索するのにかかる労力を低減することができる。
【0122】
なお、上述した実施形態で説明したコンピュータシステム2、2bの少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、コンピュータシステム2、2bの少なくとも一部の機能を実現するプログラムをコンピュータ読み取り可能な記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0123】
また、コンピュータシステム2、2bの少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0124】
さらに、一つまたは複数の情報機器によってコンピュータシステム2、2bを機能させてもよい。複数の情報機器を用いる場合、そのうちの1つをコンピュータとし、当該コンピュータが所定のプログラムを実行することによりコンピュータシステム2、2bの少なくとも1つの手段として機能が実現されてもよい。
【0125】
また、方法の発明においては、全ての工程(ステップ)をコンピュータによって自動制御で実現するようにしてもよい。また、各工程をコンピュータに実施させながら、工程間の進行制御を人の手によって実施するようにしてもよい。また、さらには、全工程のうちの少なくとも一部を人の手によって実施するようにしてもよい。
【0126】
以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0127】
S 情報処理システム
1 端末
11 入力インタフェース
12 通信モジュール
13 記憶装置
14 メモリ
15 出力インタフェース
16 プロセッサ
17 ディスプレイ
2 情報処理システム
21 入力インタフェース
22 通信モジュール
23 記憶装置
24 メモリ
25 出力インタフェース
26 プロセッサ
260 スコア決定部
261 取得部
262 用途スコア部
263 特性スコア部
264 出力部
265 決定部
266 判定部
267 算出部
268 推定部
269 決定部
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図9C
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20