IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

<>
  • 特許-候補アイディアを生成するシステム 図1
  • 特許-候補アイディアを生成するシステム 図2
  • 特許-候補アイディアを生成するシステム 図3
  • 特許-候補アイディアを生成するシステム 図4
  • 特許-候補アイディアを生成するシステム 図5
  • 特許-候補アイディアを生成するシステム 図6
  • 特許-候補アイディアを生成するシステム 図7
  • 特許-候補アイディアを生成するシステム 図8
  • 特許-候補アイディアを生成するシステム 図9
  • 特許-候補アイディアを生成するシステム 図10
  • 特許-候補アイディアを生成するシステム 図11
  • 特許-候補アイディアを生成するシステム 図12
  • 特許-候補アイディアを生成するシステム 図13
  • 特許-候補アイディアを生成するシステム 図14A
  • 特許-候補アイディアを生成するシステム 図14B
  • 特許-候補アイディアを生成するシステム 図15
  • 特許-候補アイディアを生成するシステム 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-27
(45)【発行日】2024-12-05
(54)【発明の名称】候補アイディアを生成するシステム
(51)【国際特許分類】
   G06N 3/08 20230101AFI20241128BHJP
【FI】
G06N3/08
【請求項の数】 9
(21)【出願番号】P 2021045937
(22)【出願日】2021-03-19
(65)【公開番号】P2022144778
(43)【公開日】2022-10-03
【審査請求日】2023-08-28
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001678
【氏名又は名称】藤央弁理士法人
(72)【発明者】
【氏名】刑部 好弘
(72)【発明者】
【氏名】淺原 彰規
【審査官】北川 純次
(56)【参考文献】
【文献】特開2020-187642(JP,A)
【文献】特開2005-063312(JP,A)
【文献】米国特許出願公開第2018/0336490(US,A1)
【文献】GOMEZ-BOMBARELLI, Rafael et al.,Automatic Chemical Design Using a Data-Driven Continuous Representation of Molecules,ACS central science,ACS Publications,2018年01月12日,pages 268-276
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00 - 99/00
G06Q 10/00
G06F 30/00
(57)【特許請求の範囲】
【請求項1】
補アイディアを生成するシステムであって、
1以上のプロセッサと、
前記1以上のプロセッサが実行するプログラムを格納する1以上の記憶装置と、を含み、
前記1以上のプロセッサは、
1入力アイディアベクトルを、学習済みモデルを使用して、多変量空間に属する第1縮約ベクトルに変換し、
記第1縮約ベクトルの前記多変量空間における第1所定成分の値に基づいて、前記多変量空間から1以上の第2縮約ベクトルを抽出し、
前記1以上の第2縮約ベクトルそれぞれに基づき、学習済みモデルを使用して候補アイディアを表す1以上の第1出力アイディアベクトルを出力し、
前記学習済みモデルは、縮約ベクトルの入力アイディアベクトルと出力アイディアベクトルとの間の類似度を表す項、及び、前記第1所定成分と第1所定指標値との類似度を表す項、を含む目的関数を使用して学習済みである、システム。
【請求項2】
請求項1に記載のシステムであって、
前記1以上のプロセッサは、前記第1縮約ベクトルの前記第1所定成分及び第2所定成分に基づいて前記1以上の第2縮約ベクトルを抽出し、
前記目的関数は、前記第2所定成分と第2所定指標値との類似度を表す項をさらに含む、システム。
【請求項3】
請求項1に記載のシステムであって、
前記第1所定成分と前記第1所定指標値との類似度は、前記第1所定成分と前記第1所定指標値との相関を示し、
前記入力アイディアベクトルと前記出力アイディアベクトルとの類似度は、ユークリッド距離で表される、システム。
【請求項4】
請求項1に記載のシステムであって、
前記1以上のプロセッサは、前記1以上の第2縮約ベクトルの抽出において、前記第1縮約ベクトルの前記第1所定成分に、1以上の所定バイアスを与える、システム。
【請求項5】
請求項1に記載のシステムであって、
前記1以上のプロセッサは、複数のアイディアから、前記第1所定指標値と目標値との差異が所定範囲内にあるアイディアを選択し、前記選択したアイディアから前記第1入力アイディアベクトルを生成する、システム。
【請求項6】
請求項1に記載のシステムであって、
前記1以上の第2縮約ベクトルは複数の第2縮約ベクトルであり、
前記複数の第2縮約ベクトルの抽出において、前記1以上のプロセッサは、前記第1縮約ベクトルの前記第1所定成分に対して、前記複数の第2縮約ベクトルそれぞれのために異なるバイアスを与える、システム。
【請求項7】
請求項1に記載のシステムであって、
前記1以上の記憶装置は、提案済みのアイディアを管理し、
前記1以上の第2縮約ベクトルは複数の第2縮約ベクトルであり、
前記1以上のプロセッサは、前記提案済みのアイディアの前記多変量空間における縮約ベクトルと前記複数の第2縮約ベクトルとの間の類似度に基づいて、ユーザに提案する候補アイディアの第2縮約ベクトルを選択する、システム。
【請求項8】
請求項1に記載のシステムであって、
前記アイディアは、材料又は語句の少なくとも一方を含み、
前記1以上のプロセッサは、前記1以上の第1出力アイディアベクトルを、アイディアを表す表現に変換して表示する、システム。
【請求項9】
システムが、候補アイディアを生成する方法であって、
前記システムが、第1入力アイディアベクトルを、学習済みモデルを使用して、多変量空間に属する第1縮約ベクトルに変換し、
前記システムが、前記第1縮約ベクトルの前記多変量空間における第1所定成分の値に基づいて、前記多変量空間から1以上の第2縮約ベクトルを抽出し、
前記システムが、前記1以上の第2縮約ベクトルに基づき、学習済みモデルを使用して候補アイディアを表す1以上の第1出力アイディアベクトルを出力し、
前記学習済みモデルは、縮約ベクトルの入力アイディアベクトルと出力アイディアベクトルとの間の類似度を表す項、及び、前記第1所定成分と第1所定指標値との類似度を表す項、を含む目的関数を使用して学習済みである、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、候補アイディアを生成するシステムに関する。
【背景技術】
【0002】
現実世界での観測データをサイバー空間で数値化し定量的に分析することで、システムの効率化や知的生産性向上などを目指す仕組みをサイバーフィジカルシステム(CPS)と呼ぶ。近年では、IoT(Internet of Things)などのセンシング技術や、大量のデータを収集し分析することのできるコンピューティング技術などが成熟してきたことにより、サイバー空間とフィジカル空間をより緊密に連携させることが可能になってきている。
【0003】
特にCPSを用いたシステムの最適化は、現状の改善策を立案するフェーズと、その改善策を講じた場合に実際にどうなったか観測するフェーズを交互に行うことで実現される。観測結果、すなわちアイディアの質を評価してフィードバックすることで、次なる立案フェーズでより効果の高い改善策を提案することを目指す。
【0004】
近年では、人工知能技術を用いた内挿的探索手法をこの立案フェーズで用いて、事前に改善確度の高いアイディアを候補施策として提示する技術が提案されている。たとえば、ベイズ最適化は既知情報から算出される期待値をもとにして、次に試すべきアイディアを割り出す手法である。非特許文献1は、材料開発において次に実験すべき候補化合物を探索するためにベイズ最適化を用いる手法を開示する。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2020-95452号公報
【非特許文献】
【0006】
【文献】R. Griffiths et al., “Constrained Bayesian optimization for automatic chemical design using variational autoencoders,” Chemical Science, 11(2), 577-586 (2020)
【発明の概要】
【発明が解決しようとする課題】
【0007】
現在の人工知能技術は既知情報を基にした内挿的探索手法が主である。これは初期値に強く依存する探索手法である。つまり、過去の試行条件が偏っている場合、次に試すべき候補アイディアも過去の試行に類似しすぎてしまい、アイディアの多様性を欠くという問題がある。
【0008】
たとえば、試行錯誤の末に発見されたアイディアの現状改善効果ならびにその経済効果が極めて高い場合、アイディアの試行に多少のコストがかかっても十分利益を回収できる。こうしたケースでは、内挿的探索手法ではなく、むしろこれまで試してこなかったアイディアを試行する方が効率は良いと思われる。しかし、単なるランダム探索等は過去の試行結果を考慮しないため、これもまた探索効率が悪いという課題がある。
【0009】
したがって、次に質を評価すべき候補アイディアを探索するときに、候補アイディアの新規性と、既知データに基づいて予測される候補アイディアの質の両者を同時に考慮して探索する技術が望まれる。
【課題を解決するための手段】
【0010】
本発明の一態様は、次に評価する候補アイディアを生成するシステムであって、1以上のプロセッサと、前記1以上のプロセッサが実行するプログラムを格納する1以上の記憶装置と、を含み、前記1以上のプロセッサは、アイディアを表す第1入力アイディアベクトルを、第1縮約ベクトルに変換し、前記第1縮約ベクトルが属する多変量空間において、前記第1縮約ベクトルの前記多変量空間における第1所定成分の値に基づいて、1以上の第2縮約ベクトルを生成し、前記1以上の第2縮約ベクトルそれぞれから、ユーザに提示する候補アイディアを表す1以上の第1出力アイディアベクトルを生成する、前記多変量空間は、縮約ベクトルを生成する入力アイディアベクトルと前記縮約ベクトルから生成される出力アイディアベクトルとの類似度と、前記縮約ベクトルの第1所定成分と前記第1所定指標値の類似度とが、維持されるように構成されている。
【発明の効果】
【0011】
本発明の一態様によれば、候補アイディアの新規性と質とに基づき、次の試行で評価するべき候補アイディアを生成できる。
【図面の簡単な説明】
【0012】
図1】本明細書の一実施形態に係る候補アイディア提案システムの論理構成の一例を示す。
図2】候補アイディア生成装置、データ保存装置及びユーザインタフェースのハードウェア構成例を示す。
図3】パラメータデータベースに含まれる、パラメータデータの例を示す。
図4】アイディア表現データベースの構成例を示す。
図5】アイディアベクトルデータベースの構成例を示す。
図6】アイディアベクトル化モジュールの処理例のフローチャートである。
図7】アイディア表現である化学構造式から、アイディアベクトルである構造式ベクトルを生成する例を示す。
図8】縮約ベクトルデータベースの構成例を示す。
図9】アイディア縮約モジュールの処理例を示すフローチャートである。
図10】変分オートエンコーダの構成例を示す。
図11】縮約空間探索モジュールの処理例を示すフローチャートである。
図12】候補アイディアデータベースの構成例を示す。
図13】候補アイディア生成モジュールの処理例のフローチャートである。
図14A】実施例2に係る発想支援アプリケーションのユーザインタフェース(画面)の例を示す。
図14B】実施例2に係る発想支援アプリケーションのユーザインタフェース(画面)の例を示す。
図15】評価結果テーブルの構成例を示す
図16】単語ベクトルの例を示す。
【発明を実施するための形態】
【0013】
以下においては、便宜上その必要があるときは、複数のセクションまたは実施例に分割して説明するが、特に明示した場合を除き、それらは互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。また、以下において、要素の数等(個数、数値、量、範囲等を含む)に言及する場合、特に明示した場合及び原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよい。
【0014】
本システムは、物理的な計算機システム(一つ以上の物理的な計算機)でもよいし、クラウド基盤のような計算リソース群(複数の計算リソース)上に構築されたシステムでもよい。計算機システムあるいは計算リソース群は、1以上のインタフェース装置(例えば通信装置及び入出力装置を含む)、1以上の記憶装置(例えば、メモリ(主記憶)及び補助記憶装置を含む)、及び、1以上のプロセッサを含む。
【0015】
プログラムがプロセッサによって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び/またはインタフェース装置等を用いながら行われるため、機能はプロセッサの少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセッサあるいはそのプロセッサを有するシステムが行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機または計算機が読み取り可能な記憶媒体(例えば計算機読み取り可能な非一過性記憶媒体)であってもよい。各機能の説明は一例であり、複数の機能が一つの機能にまとめられたり、一つの機能が複数の機能に分割されたりしてもよい。
〔概略〕
【0016】
以下において、次の試行で質を評価するべき候補アイディアを生成する技術が開示される。アイディアは、様々な表現形式で表され得る。材料開発における化学構造式や実験条件は、次に実験すべきアイディアの一形態である。化学構造式の表現形式は、例えば、一定の文法規則に従って記述された文字列や、行列であり得る。文法規則の例は、SMILES(Simplified Molecular Input Line Entry System)である。以下に説明する実施例は、化学構造式を記述する文法規則の一例として、SMILESを使用する。
【0017】
研究開発戦略立案におけるレポート(文書)は、次に研究開発すべき指針を示すアイディアの一形態である。文書に含まれる文章、あるいは文章に対して形態素解析を行ったあとに得られるベクトル表現なども、アイディアの一形態である。
【0018】
図1は、本明細書の一実施形態に係る候補アイディア提案システムの論理構成の一例を示す。候補アイディア提案システムは、候補アイディア生成装置M01、データ保存装置M02、及びユーザインタフェースM05を含む。これらは、ネットワークを介して互いに通信可能である。候補アイディア生成装置M01は、ユーザに提案する候補アイディアを生成する。候補アイディア生成装置M01は、アイディアベクトル化モジュールP01、アイディア縮約モジュールP02、縮約空間探索モジュールP03、及び候補アイディア生成モジュールP04を含む。
【0019】
データ保存装置M02は、候補アイディア生成装置M01が参照又は生成するデータを格納する。図1の構成例において、データ保存装置M02は、各種データベースを格納する。具体的には、アイディア表現データベースDB01、アイディアベクトルデータベースDB02、縮約ベクトルデータベースDB03、候補アイディアデータベースDB04、モデルデータベースDB05、及びパラメータデータベースDB06が格納されている。データ保存装置M02は、さらに、データベースDB01からDB06を管理する。データ管理モジュールP06を含む。
【0020】
ユーザインタフェースM05は、ユーザによりデータ入力及びユーザに対する情報の提示を行う。ユーザインタフェースM05は、表示部P07及び入力受付部P08を含む。表示部P07は、例えば、候補アイディア生成装置M01が生成した情報をユーザに対して提示する。入力受付部P08は、例えば、候補アイディア生成装置M01が処理を行うために必要な情報をユーザから受け付ける。
【0021】
候補アイディア生成装置M01のアイディアベクトル化モジュールP01は、所定の形式で表されたアイディア表現を予め決められている所定の方法に従って実数ベクトル、すなわちアイディアベクトルに変換する。
【0022】
アイディア縮約モジュールP02は、アイディアベクトル化モジュールP01からのアイディアベクトルを、別の実数ベクトル、すなわち縮約ベクトルに変換する。アイディア縮約モジュールP02は、ユーザによって事前に設定される1以上の指標値の類似度が、縮約ベクトルによって構成される多変量空間における距離と対応するように変換する。例えば、アイディア縮約モジュールP02は、入力されたアイディアベクトルの類似度と、アイディアの質の指標値の類似度とが相関するように、縮約ベクトルによって構成される多変量空間を変換する。
【0023】
アイディア縮約モジュールP02は、例えば、1つの変分オートエンコーダ(VAE)を含むことができる。VAEは、オートエンコーダの一種であり、エンコーダとデコーダの二つのニューラルネットワークから構成される深層生成モデルである。エンコーダは、入力(ベクトル)を実数ベクトルに変換する。実数ベクトルが属する空間は潜在空間と呼ばれ、所定の分布、例えば正規分布に従うことが仮定される。デコーダは、その実数ベクトルを逆変換し、入力と等しい次元のベクトルを出力する。
【0024】
一般的なエンコーダ及びデコーダは、入力と出力とが等しくなるように訓練される(学習する)。中間出力の実数ベクトルから入力を再構成できることは、入力の十分な特徴が実数ベクトルに反映されていることを意味する。潜在空間の次元は、入力の次元よりも小さくなるように設定される。そのため、エンコーダは、入力の特徴量を抽出すると共に、入力の次元を圧縮することができる。
【0025】
中間出力のベクトルは、潜在変数又は潜在ベクトルと呼ばれ、入力されたアイディアベクトルから抽出した特徴を表す抽象表現である。したがって、VAEの潜在ベクトルは縮約ベクトルである。潜在ベクトルは、所定の分布、例えばガウス分布に従うことが仮定される。したがって、デコーダは、例えば、ノイズが加えられたベクトルを受け取った場合に、入力されたベクトルを高い精度で復元することができる。このように、VAEは、生成モデルとして高いロバスト性を有する。
【0026】
VAEが潜在空間を構成する学習(訓練)過程では、損失関数の出力値(損失)が小さくなるようにニューラルネットワークのパラメータが逐次的に最適化される。一般的には、入力と出力との誤差、すなわち再構成誤差を小さくするように訓練される。本明細書の一実施形態において、再構成誤差に別の項を付与した損失関数を定義する。
【0027】
第一には、潜在ベクトルにおける1以上の所定の成分と、所定の指標値、たとえば、アイディアの質を表す指標値との類似度を示す項を、損失関数に含める。類似度を表す項は、例えば、相関を表す項や、ある特定のデータからのユークリッド距離を表す項等があり得る。例えば、相関を表す値が大きくなると損失が小さくなるような項を損失関数に付け加える。この損失関数を用いて訓練されたVAEの潜在空間は、入力されたアイディアベクトルとそれに対応する出力ベクトルの類似度と、潜在ベクトルにおける所定の成分と所定の指標値との類似度の両方が維持された、多変量空間である。
【0028】
この他にも、候補アイディアの探索目的に応じた項を損失関数に付け加えることで、所望の類似度を反映した潜在空間をVAEに構成させることができる。たとえば、過去に本システムが提案した候補アイディアの実際の質の指標値(真値)が判明している場合、提案時に予測されたアイディアの質(予測値)と、指標値の真値との誤差を損失関数に加えることができる。これにより、予測値と真値との類似度を反映した潜在空間を構成することができるため、予測が大きく外れやすい領域をあらかじめ避けることが可能となる。
【0029】
さらに、実験によって求めた真値のかわりに、別のデータセットによって訓練された機械学習システムに判定させた予測値や、物理学ないし化学に基づく理論計算によって算出された理論値を用いてもよい。
【0030】
縮約空間探索モジュールP03は、縮約ベクトルによって構成される多変量空間において、目標値、たとえば探索時点で最も質の高い既知アイディアと対応する縮約ベクトルの近傍を勾配法に基づき探索することで、さらに望ましい縮約ベクトルを発見し得る。上述のように、潜在ベクトルにおける所定の成分とアイディアの質の指標値とは相関しているため、所定の成分を所定の方法で変更することで、その軸に沿った勾配法に基づく探索を実現することができる。例えば、所定の成分に対して、所定の値が加減算される。
【0031】
候補アイディア生成モジュールP04は、縮約空間探索モジュールP03が発見した縮約ベクトルを受け取り、事前にユーザが設定した出力形式へと変換する。例えば、縮約ベクトルをまずアイディアベクトルへ、次にアイディア表現へと順次逆変換する。これにより、入力されたアイディア表現と同じ表現形式に復元することで、縮約ベクトルをユーザが理解できる表現形式に直す。
【0032】
本明細書の一実施形態は、主に以下のステップを実行する。まず、システムは、ユーザ設定とデータとを受け取り、アイディアベクトル化モジュールP01を実行する。続いて、システムは、アイディア縮約モジュールP02を構成するVAEを学習する。VAEの学習が完了すると、システムは、縮約空間探索モジュールP03及び続く候補アイディア生成モジュールP04によって、次に質を評価すべき候補アイディアを生成する。生成された候補合いでは、ユーザインタフェースM05を介してユーザに提示される。
【0033】
VAEの学習は本システムが稼働する際にまず行われなければならない。2回目以降の探索では、学習のステップは省略してもよい。また、アイディアの新しい試行結果が入力されたときには、そのデータを用いて追加で学習を実施してもよい。
【0034】
本システムを運用すると、過去に提案したアイディアの質の指標値の真値を得ることができる。このとき、ユーザはユーザインタフェースM05を介してその真値を本システムに入力することができる。データ管理モジュールP06は、保存されているアイディアの検索機能と、候補アイディアの質の実際の指標値の入力を受け付けて保存する機能を有する。図2は、候補アイディア生成装置M01、データ保存装置M02、及びユーザインタフェースM05のハードウェア構成例を示す。候補アイディア生成装置M01は、演算性能を有するプロセッサU111と、プロセッサU111が実行するプログラム及びデータを格納する揮発性一時記憶領域を与えるDRAMU112と、を含む。
【0035】
候補アイディア生成装置M01は、さらに、本システムにおける他の装置を含む他の装置とデータ通信をおこなう通信装置U113と、HDD(Hard Disk Drive)やフラッシュメモリなどを利用した永続的な情報記憶領域を与える補助記憶装置U114と、を含む。また、候補アイディア生成装置M01は、ユーザからの操作を受け付ける入力装置U115と、各プロセスでの出力結果をユーザに提示するモニタU116(出力装置の例)と、を含む。
【0036】
例えば、候補アイディア生成装置M01は、アイディアベクトル化モジュールP01、アイディア縮約モジュールP02、縮約空間探索モジュールP03、及び候補アイディア生成モジュールP04等のプログラムを格納する。プロセッサU111が実行するプログラム及び処理対象のデータは、補助記憶装置U114からDRAMU112にロードされる。
【0037】
データ保存装置M02を構成するハードウェア要素は、候補アイディア生成装置M01と同様でよい。例えば、データ保存装置M02は、図1に示す各種データベースDB01からDB06及びデータ管理モジュールP06等のプログラムを格納し、データ管理モジュールP06を実行する。ユーザインタフェースM05を構成するハードウェア要素は、候補アイディア生成装置M01と同様でよい。例えば、ユーザインタフェースM05は、表示部P07及び入力受付部P08を実行する。
【0038】
なお、複数の装置に分かれている機能を一つの装置に統合してもよく、上記複数の装置機能をさらに多くの装置に分散してもよい。このように、候補アイディア提案システムは、1以上の記憶装置及び1以上のプロセッサを含む。
【実施例1】
【0039】
実施例1では、次に実験すべき候補化合物の構造式を探索し提示する。ユーザは、いずれかの装置の入力装置を介して、パラメータデータベースDB06を設定することができる。パラメータデータベースDB06は、候補アイディア生成装置M01の処理に必要なデータを格納する。
【0040】
パラメータデータベースDB06は、例えば、アイディアベクトル化モジュールP01が、アイディアベクトルを生成するために参照する情報を含むことができる。一例として、SMILES記法によって表現された化学構造式を行列へ変換するための語彙情報を含む。また、パラメータデータベースDB0は、アイディア縮約モジュールP02の構成情報を含むことができる。具体的には、パラメータデータベースDB06は、アイディア縮約モジュールP02の構造及び学習パラメータなどを記載する。
【0041】
図3は、パラメータデータベースDB06に含まれる、パラメータデータの例を示す。例えば、セクション61の「TableNames」は、SMILES記法によって表現された化学構造式を行列へ変換するための語彙情報を格納するテーブルを示す。セクション62の「TargetProperties」は、化合物の質を示す特性値(目的変数)についてのパラメータを示す。具体的には、mwt及びlopPについての特性値が示されている。これら特性値は、アイディア縮約モジュールP02の学習や、縮約空間探索モジュールP03による縮約ベクトルの探索において参照される。
【0042】
セクション63の「VAEInitialParams」は、アイディア縮約モジュールP02のネットワーク構成のパラメータを示す。本例のアイディア縮約モジュールP02はVAEを含むため、VAEの構成パラメータが示されている。例えば、「CorrDimIndex」は、どの次元に相関をもたせるかを規定し、「CorrDir」は、正負どちらにバイアスかけるのが望ましい方向か、を規定する。
【0043】
セクション64の「SearchParams」は、縮約空間探索モジュールP03による縮約ベクトルの探索において参照されるパラメータを示す。本例において、提示する候補縮約ベクトルをフィルタリングするための条件が示されている。
【0044】
アイディア表現データベースDB01を説明する。ユーザは、ユーザインタフェースM05を介して、アイディア表現データベースDB01にデータを格納することができる。アイディア表現データベースDB01は、過去の実験条件ならびに実験結果の情報を含む。アイディア表現データベースDB01は、これまで試行したアイディアを格納する。どのようなアイディアを試し、どういうKPIが得られたのかが、対応付いて蓄積されている。例えば、材料開発においては、実験データが該当する。
【0045】
図4は、アイディア表現データベースDB01の構成例を示す。図4に示す例において、ID欄T1C1はレコードの識別子を表す。SuggestID欄T1C21は、過去に本システムが提案した候補アイディアの識別子を示す。この欄T1C21は、候補アイディアデータベースDB04のSuggestID欄T4C1と紐づいている。SuggestID欄T1C21において、過去に提示していない実験については空欄または空欄を示す記号「-」が入力される。このように、アイディア表現データベースDB01は、過去に提案済みの材料(実験結果)と未提案の材料(実験結果)の双方を格納している。
【0046】
TimeStamp欄T1C2は実験した日付を表す。mwt欄T1C3は分子量を示す。本例において、分子量は、改善したい目的変数の1つであって、値が大きい方が望ましい量である。logP欄T1C4は、水分配係数を示す。本例において、logPは改善したい目的変数の1つであって、値が小さい方が望ましい量である。SMILES欄T1C5はSMILES記法により表された化学構造式を示す。catalyst欄T1C6は触媒を示し、実験条件の1つである。temp欄T1C7は合成温度を示し、実験条件の1つである。
【0047】
アイディア表現データベースDB01は、化合物の特性のいくつかの推定値の欄を含む。後述するように、アイディア縮約モジュールP02のVAEは、化合物の特性値を入力として受け取り、それら特性値の予測値を出力する。
【0048】
具体的には、pred_mwt欄T1C8は本システムが過去に提案した候補アイディアのmwtの予測値を示す。「pred_logP」は本システムが過去に提案した候補アイディアのlogPの予測値である。「pred_catalyst」欄T1C10は、本システムが過去に候補アイディアとして提案した際のcatalystの予測値を示す。「pred_temp」欄T1C11は、本システムが過去に提案した候補アイディアのtempの予測値を示す。pred_を含む欄T1C8からT1C11において、過去に提示していない実験については、空欄または空欄を示す記号「-」が入力される。
【0049】
上述のように、図4に示す構成例は、ID及びTimeStamp(実験日)という識別情報、SMILESという有機化合物の構造式情報、catalyst、tempというプロセス条件情報、そして、mwt、logPというKPI(目的変数)を記載している。1又は複数のKPI(目的変数)を設定することができる。複数のKPIを設定することで、それらKPIに即した候補アイディアを提案できる。
【0050】
次に、アイディアベクトル化モジュールP01の処理を説明する。アイディアベクトル化モジュールP01は、アイディア表現データベースDB01から、アイディアベクトルデータベースDB02を生成する。
【0051】
図5は、アイディアベクトルデータベースDB02の構成例を示す。アイディアベクトルデータベースDB02は、アイディア表現データベースDB01のデータに加えて、idea_vector欄T2C5を含む。idea_vector欄T2C5は、アイディア表現のベクトル、本例において、SMILES記法により表現された化学構造式のベクトルを示す。
【0052】
図6はアイディアベクトル化モジュールP01の処理例のフローチャートである。アイディアベクトル化モジュールP01は、パラメータデータベースDB06からパラメータデータを読み込む。続いて、アイディア表現データベースDB01からアイディア表現データを読み込む(S101)。
【0053】
続いて、アイディアベクトル化モジュールP01は、パラメータデータに記載された語彙情報を用いて、SMILES記法によって表現された化学構造式をベクトル(行列)へと変換する。なお、行列とベクトルは配列の表現方法の例であり、同一の配列をベクトル及び行列で表すことができる。この変換方法は、たとえばone-hotエンコードとして広く知られている方法を用いることができる。この方法によれば、化学構造式とベクトルは1対1対応しており逆変換が可能である。
【0054】
続いて、アイディアベクトル化モジュールP01は、アイディア表現データベースDB01を複製し、idea_vector欄T2C5を追加して、対応する変換後のベクトルを格納し、アイディアベクトルデータベースDB02として書き出す。
【0055】
図7は、アイディア表現である化学構造式から、アイディアベクトルである構造式ベクトルを生成する例を示す。アイディアベクトル化モジュールP01は、one-hotエンコードによって、SMILES記法によって表現された化学構造式をベクトルへと変換する。
【0056】
次に、アイディア縮約モジュールP02の処理を説明する。アイディア縮約モジュールP02は、アイディアベクトルデータベースDB02から、縮約ベクトルデータベースDB03を生成する。
【0057】
図8は、縮約ベクトルデータベースDB03の構成例を示す。縮約ベクトルデータベースDB03は、は、アイディアベクトルデータベースDB02のデータに加えて、abst_vector欄T3C5を含む。abst_vector欄T3C5は、アイディアベクトルの縮約ベクトルを格納する。本例において、アイディアベクトルは、SMILES記法により表現された化学構造式を表すベクトルである。
【0058】
図9は、アイディア縮約モジュールP02の処理例を示すフローチャートである。アイディア縮約モジュールP02は、まずパラメータデータベースDB06から、パラメータデータを読み込む(S151)。さらに、アイディア縮約モジュールP02は、モデルデータべ-スDB05からモデルデータを読み込む(S152)。さらに、アイディア縮約モジュールP02は、アイディアベクトルデータベースDB02から、アイディアベクトルデータを読み込む(S153)。
【0059】
続いて、アイディア縮約モジュールP02は、VAEモデルをインスタンス化する(S154)。学習済みモデルが保存されている場合には、その学習済みモデルをインスタンス化する。もし学習済みのVAEが保存されていない場合、アイディア縮約モジュールP02は、パラメータデータに記載されている初期値を用いて(ニューラルネットワーク)VAEを初期化する。
【0060】
図10は、VAEの構成例を示す。VAEのエンコーダは、例えば、外側エンコーダ211と、その後段の内側エンコーダ212で構成できる。外側エンコーダ211は複数の1次元畳み込み層で構成され、内側エンコーダ212は、複数の全結合層で構成され得る。エンコーダは、M×N次元の行列で表すことができる化学構造式のベクトル202と、SMILES以外の説明変数を連結したベクトル203と、を入力データ201として受け取る。VAEのエンコーダは、入力データ201を、L×1次元のベクトル214(以下、単にL次元ベクトルと記載する)に変換する。このベクトル214は、潜在空間213における縮約ベクトルである。
【0061】
エンコーダは、外側エンコーダ211(畳み込み層)の最終レイヤの出力ベクトルと、アイディアベクトルデータベースDB02に含まれるSMILES以外の説明変数を連結したベクトルと、を連結してベクトルV1を生成する。エンコーダは、ベクトルV1を畳み込み層の最終レイヤに続く内側エンコーダ212(全結合層)に入力して、L次元ベクトル214を生成する。
【0062】
本例において、KPIであるmwt及びlogP並びに実験条件のcatalyst及びtempが、ベクトル203(ベクトルV1)に含まれ、エンコーダの内側エンコーダ212に入力される。こうすることで、特性値や実験条件も含めてエンコードすることができる。他の構成例において、化合物の特性推定値等が不要であれば、SMILES以外の説明変数は入力データに含まれていなくてもよい。
【0063】
デコーダは、例えば、内側デコーダ215と、その後段の外側デコーダ216で構成できる。内側デコーダ215は複数の全結合層で構成され得、外側デコーダ216はRNN(Recurrent Neural Network)で構成できる。デコーダは、L次元ベクトル214を入力として受け取り、M×N次元の行列に対応する化学構造式を表すベクトル222と、化学構造式以外の説明変数からなるベクトル223に、逆変換する。出力される化学構造式222は、入力される化学構造式とわずかに異なるものであり得る。また、化学構造式222と合わせて、入力される化学構造式以外の説明変数の予測値223が出力データ221に含まれる。
【0064】
エンコーダがSMILESを変換した行列以外の説明変数もエンコードしているため、全結合層の最終レイヤの出力ベクトルV2を分割する。これにより、復元された説明変数、例えば、mwt、logP、catalyst、及びtemp(の予測値)も得ることができる。V1の結合位置とV2の分割位置は、一致している。
【0065】
分割された一方は、外側デコーダ216に入力されて、化学構造を示すベクトル(行列)222が出力される。他方は、化学構造以外の入力された変数の予測値223として出力される。なお、図10はアイディア縮約モジュールP02が縮約ベクトルを形成するためのモデルの一例を示すものであって、設計に応じて任意のモデルを使用することができる。
【0066】
図9に戻って、ステップS155以降のステップは、深層学習で一般に用いられているバッチ処理に基づく再帰的な処理(学習処理)が続く。つまり、学習データのうちバッチサイズによって指定されたデータ数ずつ処理される。すべてのバッチが1回ずつ処理されるまでを1エポックとよび、実際の学習は、複数エポック反復実行される。以降は1バッチで行われる処理を説明する。
【0067】
まず、アイディア縮約モジュールP02は、学習対象となるアイディアベクトルをバッチ数分だけVAEに入力する(S155)。エンコーダの入力とデコーダの出力との誤差から、再構成誤差U0を算出する(S156)。再構成誤差U0の計算方法は任意であり、例えば、バッチに含まれるサンプルそれぞれのVAEの入力と出力の誤差の平均値でもよい。本例のように、SMILESだけでなく、特性値(mwt、logP)や実験条件(catalyst、temp)も含めてVAEを学習させている場合、その部分も含めた再構成誤差が算出される。
【0068】
次に、アイディア縮約モジュールP02は、アイディア縮約ベクトルにおける所定の成分と目的変数(KPI)との相関係数を計算する(S157)。例えば、アイディア縮約モジュールP02は、エンコーダの出力ベクトル(縮約ベクトル)の所定の第1成分とmwtとの相関係数R0を計算する。次に、エンコーダの出力ベクトル(縮約ベクトル)の所定の第2成分と、logPとの相関係数R1を計算する。
【0069】
どの目的変数とどの成分との相関をとるかは、パラメータデータの「CorrDimIndex」で指定する。相関の計算方法は任意である。例えば、相関を算出するカーネル関数を定義してもよく、共分散と平均に基づき算出される相関係数を使ってもよく、異なる方法で算出された相関係数と重みの積和を使用してもよい。
【0070】
続いて、アイディア縮約モジュールP02は、特性値の真値と予測値との間の誤差(差分)を算出する。真値はVAEへの入力であり、予測値は出力である。例えば、アイディア縮約モジュールP02は、アイディアベクトルデータベースDB02のmwt欄T1C3の値とpred_mwt欄T1C8の値の差分、及びlogP欄T1C4の値とpred_logP欄T1C9の値の差分を算出し、それらの和W0を算出する(S158)。
【0071】
和W0は、例えば、複数のサンプルの特性値の差分の和である。異なる特性の値の差分の和は、単純な和でもよいし、パラメータデータによって指定した重みを乗じたあとの和でもよい。なお、特性値(mwt、logP)の誤差W0の算出は省略してもよい。その構成において、VAEの入力データ及び出力データは、特性値(KPI)を含まなくてもよい。実験条件は、誤差がLoss関数に含まれていないので省略可能である。
【0072】
続いて、アイディア縮約モジュールP02は、再構成誤差U0と相関係数R0と相関係数R1と目的変数の真値と予測値の差分W0の和から、損失Lossを計算する。Lossが小さくなるようにニューラルネットワークは学習するため、適切に符号を設定する。たとえば、R0およびR1の符号はパラメータデータの「CorrDir」であらかじめ設定される。
【0073】
アイディア縮約モジュールP02は、このLossに基づき、VAEは、パラメータを最適化するように更新する(S159)。本例においては、再構成誤差U0及び特性値誤差W0が小さくなり、相関R1、R2が大きくなるように、VAEのパラメータが更新される。なお、Loss関数における変数の符号は設計により決定され、例えば、相関が小さくなるときにLoss関数が小さくなるように符号が決定されてもよい。
【0074】
次に、アイディア縮約モジュールP02は、学習が終了したか判定する(S160)。本例では、所定のエポック数分だけ前記の学習処理を終わらせた場合に終了フラグが立つ。そうでない場合は(S160:NO)、ステップS155に戻って処理を続ける。
【0075】
学習プロセスが終了したあと(S160:YES)、アイディア縮約モジュールP02は、学習済みモデルのパラメータをモデルデータベースDB05に書き出し保存する(S161)。
【0076】
続いて、アイディア縮約モジュールP02は、学習済みのVAEもう一度すべてのアイディアベクトルを入力し、エンコーダの出力を取得することで縮約ベクトルへと変換する(S162)。
【0077】
続いて、アイディア縮約モジュールP02は、アイディアベクトルデータベースDB02の構成にabst_vector欄T3C5を追加して、縮約ベクトルを格納し、このテーブルを縮約ベクトルデータベースDB03として書き出す(S163)。
【0078】
次に、縮約空間探索モジュールP03の処理を説明する。図11は、縮約空間探索モジュールP03の処理例を示すフローチャートである。縮約空間探索モジュールP03は、まずパラメータデータベースDB06から、パラメータデータを読み込む(S201)。続いて、縮約空間探索モジュールP03は、縮約ベクトルデータベースDB03を読み込む(S202)。
【0079】
続いて、縮約空間探索モジュールP03は、パラメータデータに記載された探索条件に基づき、縮約ベクトルデータベースDB03から、探索中心となる縮約ベクトルを抽出する(S203)。図3に示す例では、パラメータデータのセクション62の「TargetValue」に、各目的変数の目標値が記載されている。
【0080】
したがって、縮約ベクトルデータベースDB03において、mwtが1.6に近く、さらに、logPが-1.5に近いサンプル(レコード)が、抽出される。どの程度の近さまで抽出するかを示す所定範囲は、パラメータデータの「FilteringRange」で指定される。抽出する数は任意であって、パラメータデータが指定してもよい。なお、mwt又はlogPの少なくとも一方が目標値に近いレコードを抽出してもよく、目標値と異なる基準、例えば、ユーザに指定されたレコードが抽出されてもよい。
【0081】
続いて、縮約空間探索モジュールP03は、抽出した縮約ベクトルの第1成分及び第2成分に微小な実数を所定バイアスとして加えることにより、新しい縮約ベクトルを生成する(S204)。新しい縮約ベクトルの目的変数の値は、もとになる縮約ベクトルの目的変数の値とわずかに異なる。各縮約ベクトル与える、1以上の成分のバイアスからなるバイアスセットの数は、一つでも2以上でもよい。各縮約ベクトルに異なるバイアスセットを加えて、各縮約ベクトルから複数の新しい縮約ベクトルを生成することができる。
【0082】
各成分に加えるバイアスは、予め設定された値でよく、一つ又は異なるバイアスを各抽出した縮約ベクトルに加えることができる。加えるバイアスセットは、異なる成分で共通でも異なっていてもよい。抽出された縮約ベクトル及びバイアスにより新たに生成された縮約ベクトルは、ユーザに提示する化合物(アイディア)の候補である。
【0083】
続いて、縮約空間探索モジュールP03は、縮約ベクトルデータベースDB03のSuggestID欄T1C21に有効な値が格納された全て又は一部のレコードを抽出する。これらは、過去に提案済みのレコードである。
【0084】
縮約空間探索モジュールP03は、上記抽出又は生成した縮約ベクトルの各縮約ベクトルと、抽出した提案済みレコードの縮約ベクトルそれぞれとの間の類似度を計算する。類似度は、例えば、ユークリッド距離で表される。一例において、類似度の計算から成分0及び成分1の値が除かれる。これらの値が、類似度の計算に含まれていてもよい。さらに、縮約空間探索モジュールP03は、算出した類似度を用いて、上記目標値に基づいて抽出した縮約ベクトル及び新たに生成した縮約ベクトルにフィルタリングをかける(S205)。
【0085】
本例では候補アイディアの新規性を重視し、全ての提案済みのアイディアから所定の閾値以上離れている縮約ベクトルが残るようにフィルタリングする。閾値はパラメータデータの「threshold」で指定する。これにより、目的変数(KPI)が目標値近傍にあり、提案済みの化合物(アイディア)から離れた化合物(アイディア)を選択できる。
【0086】
続いて、縮約空間探索モジュールP03は、縮約ベクトルデータベースDB03のTimeStamp欄T1C2を参照し、現在日時から一定期間内のレコードを抽出する。
【0087】
縮約空間探索モジュールP03は、抽出したレコードそれぞれに含まれた縮約ベクトルと、上記フィルタリングにより選択された各候補縮約ベクトルと、の類似度を計算する。類似度は、上述のように、例えば、ユークリッド距離で表すことができる。類似度の計算は、提示済みアイディアと最近のアイディアとの間で同一でも異なっていてもよい。縮約空間探索モジュールP03は、類似度を用いてフィルタリングをかけて、候補縮約ベクトルから一部を選択する(S206)。
【0088】
本例では候補アイディアの時系列的な新規性を重視し、現在日時から一定期間内の全てのレコードから閾値以上離れている候補縮約ベクトルが残るようにフィルタリングする。閾値はパラメータデータの「threshold_Time」で指定でき、本例では30日間を設定する。なお、提示済みアイディアとの類似度又は最近のアイディアとの類似度の一方のみについてフィルタリングが実行されてもよく、これらフィルタリングが独立に実行されてもよい。
【0089】
続いて、縮約空間探索モジュールP03は、フィルタリング後に残った候補縮約ベクトルを、候補アイディア生成モジュールP04に渡す(S207)。
【0090】
以下において、候補アイディア生成モジュールP04の処理を説明する。候補アイディア生成モジュールP04は、候補アイディアを生成して、候補アイディアデータベースDB04に格納する。
【0091】
図12は、候補アイディアデータベースDB04の構成例を示す。図12に示す例において、SuggestID欄T4C1は、提案されたアイディアのIDを示す。SuggestDate欄T4C2は、提案した日付を表す。pred_mwt欄T4C3は、候補アイディアのmwtの予測値を示す。pred_logP欄T4C4欄は、本システムが過去に提案した候補アイディアのlogPの予測値を示す。
【0092】
SMILES欄T4C5は、本システムが過去に候補アイディアとして提案した候補化合物(候補アイディア)のSMILES表記を示す。pred_catalyst欄T4C6は、本システムが過去に候補アイディアとして提案した際のcatalystの予測値を示す。pred_temp欄T4C7は、本システムが過去に提案した候補アイディアのtempの予測値を示す。欄T41CからT4C2は、それぞれ、アイディア表現データベースDB01の同名の欄と関連づいており、同一提案の値は同一である。
【0093】
図13は、候補アイディア生成モジュールP04の処理例のフローチャートである。候補アイディア生成モジュールP04は、まずパラメータデータを読み込み(S251)、続いて縮約空間探索モジュールP03から、候補アイディアの抽象表現である縮約ベクトルを受け取る(S252)。
【0094】
続いて、候補アイディア生成モジュールP04は、モデルデータベースDB05から学習済みモデルを読み込む(S253)。ここで読み込むモデルは、アイディア縮約モジュールP02で用いたVAEと同じものである。
【0095】
続いて、候補アイディア生成モジュールP04は、縮約空間探索モジュールP03からからの縮約ベクトルを、学習済みVAEのデコーダに入力して、アイディアベクトルである行列を得る(S254)。本例においては、アイディア縮約モジュールP02は、SMILES以外の説明変数である、特性mwt及びlogP並びに実験条件catalyst及びtempをエンコードしている。そのため、候補アイディア生成モジュールP04は、上記中間出力ベクトルV2を分割することで、mwt及びlogP並びにcatalyst及びtempの出力を得る。SMILESのみがエンコードされている場合、この処理は実行されない。
【0096】
続いて、候補アイディア生成モジュールP04は、逆変換されたアイディアベクトルを所定の方法に従いアイディア表現に逆変換する(S255)。本例は、復号した行列をone-hotデコードすることにより、アイディア表現であるSMILES記法の化学構造式を得る。
【0097】
続いて、候補アイディア生成モジュールP04は、復号されたSMILESと特性値及び実験条件をまとめ、候補アイディアデータベースDB04に新しいレコードとして格納する。このとき、一意に定まる識別子をSuggestID欄4T1Cに、実行日時をSuggestDate欄T4C2にそれぞれ補う。
【0098】
候補アイディア生成モジュールP04は、候補アイディアデータベースDB04に追加した更新分のデータを、ユーザインタフェースM05の表示部P07を介して表示し、ユーザに候補アイディアを提示する。
【実施例2】
【0099】
以下において、実施例2として文書解析技術をもとにした候補アイディア生成システムの実施例を開示する。特許文献、学術論文、社内報告書など各種文書や、各文書内の構成要素である文章も、アイディアの表現形態の1つである。本システムによれば、こうした既知のアイディアをもとに、新しい候補アイディアを生成及び提示して、ユーザの発想を支援することができる。
【0100】
たとえば、人のアイディア整理を支援するシステムを考える。人がアイディアを整理するプロセスは、抽象的なイメージを言語化するプロセスと捉えることができる。そして、誰が読んでも理解できる言語化に成功したアイディアが、整理されたアイディアだと位置づけることができる。つまり、ユーザが頭の中に抱いている暗黙的なアイディアを説明するための語句選択を、適切にサポートする次のようなシステムを考える。
【0101】
図14A及び14Bは、実施例2に係る発想支援アプリケーションのユーザインタフェース(画面)の例を示す。図14Aが示す画面H10Aにおけるユーザ操作の後、図14Bに示す画面H10Bでのユーザ操作が実行される。
【0102】
画面H10Aにおいて、オブジェクトH13は、「あなたの手持ち」のキーワードを示す。オブジェクトH13において、4種類のキーワードが、単語カードとして並んでいる。これらが、ユーザのアイディアを説明するための現時点での最有力な単語群である。
【0103】
システムは、「新単語」オブジェクトH12内に、新しい単語(単語カード)を提示する。ユーザはまず、現在の手持ちカードがアイディアを言語化するうえで十分かどうかを評価し、たとえば5段階評価で「現手持ちカードの説明度」H11が示すボタンを選択することでシステムに入力する。
【0104】
その後、ユーザは、手持ち単語と新単語を比較し、自分のアイディアに最も無関係な単語カードを選択し、「次へ」ボタンH14を押下することで、選択した単語カードを破棄する動作を実行する。システムは必要に応じて単語カードの入れ替えを行ったのち、図14Bに示す次の画面H10Bを表示する。
【0105】
システムは、新しい単語カードを、図14Bに示す画面H10Bの「新単語」オブジェクトH12に表示する。オブジェクトH13は、「あなたの手持ち」のキーワードを示す。図14Aを参照して説明した操作と同様に、ユーザは、現在の手持ちカードがアイディアを言語化するうえで十分かどうかを評価し、5段階評価で「現手持ちカードの説明度」H11が示すボタンを選択することでシステムに入力する。ユーザは、手持ち単語と新単語を比較し、自分のアイディアに最も無関係な単語カードを選択し、「次へ」ボタンH14を押下することで、選択した単語カードを破棄する動作を実行する。システムは必要に応じて単語カードの入れ替えを行ったのち、不図示の次の画面を表示する。
【0106】
手持ち単語群と、その単語群に対するユーザ評価は、ステップごとに記録され、評価結果テーブルに格納される。図15は、評価結果テーブルT60の構成例を示す。ステップ欄T6C1は、ユーザ評価のステップの識別子を示す。
【0107】
単語欄T6C2は、評価ステップそれぞれの手持ち単語群を示す。この単語群を表すベクトルは、単語ベクトルの例である。この単語ベクトルは、評価ステップにおける手持ち単語に含まれている単語の有無を0と1によって表している。
【0108】
評価指標欄T6C3は、評価ステップの評価結果を示す。評価指標欄T6C3は、差分評価欄T6C5及び絶対評価欄T6C6で構成されている。評価画面において入力された各評価ステップのユーザ評価は、絶対評価欄T6C6に格納される。前ステップの単語ベクトルの絶対評価と、その次の単語ベクトルの絶対評価の差が、差分評価欄T6C5に格納される。
【0109】
ユーザは、図14A及び14Bを参照して説明した単語群の評価を繰り返すことで、自分のアイディアを説明するために適した単語カードを手持ちとして残すことができ、アイディアの言語化を進めることができる。
【0110】
上術の動作を実現するために、実施例2におけるアイディアベクトル化モジュールP01は、単一の文章ないしは複数の文章を1単位とするアイディア表現を受け取って、実数ベクトルであるアイディアベクトルに変換する。こうした自然言語の表現を実数ベクトルに変換する方法は、たとえばWord2VecやDoc2Vecが広く知られる。
【0111】
あるいは、文書中に出現する単語の出現頻度や共起確率をもとに関係性の強い語彙を抽出し、特徴量としての実数ベクトルに変換する方法が知られている。これらのような、単語と直接紐づくアイディアベクトルを、単語ベクトルと呼ぶ。図16は、単語ベクトルT70の例を示す。変換対象となる文書が1レコード(1単語ベクトル)であり、1単語ベクトルは、文書中に含まれている単語の有無を0と1によって表している。
【0112】
システムは、運用初期段階では、例えば、単語ベクトル間の類似度(距離)のみを頼りに、最も近い単語群を検索し、次に示す新単語を決定する。たとえば図16の3レコードは1、成分のみ値の異なる単語ベクトル群である。現手持ち単語群が、1番目のレコードであり、システムは、類似する単語ベクトルの検索を行い、2番目と3番目のレコードを抽出したとする。システムは、ランダムにその中から3番目のレコードを選択し、差分である「分解能」を、次の新単語オブジェクトH12に提示する。
【0113】
システムの運用が一定回数を超えると、単語ベクトルとユーザ評価の組、すなわち図15の多数のレコードが蓄積される。図15の評価結果テーブルT60は、アイディアベクトルデータベースDB02の例である。実施例2のアイディア縮約モジュールP02は、実施例1と同様に、VAEを使用してもよい。アイディア縮約モジュールP02は、単語ベクトルを入力とし、エンコーダによって得られる縮約ベクトルの所定の成分とユーザ評価値との間の相関を強める損失関数を用いて、ネットワークを学習する。
【0114】
すると、実施例1と同様に、縮約空間探索モジュールP03は、アイディアの整理に寄与する有益な単語ベクトルを検索することができる。候補アイディア生成モジュールによって新しい単語ベクトルを得ることができるため、ユーザの癖や関心対象に応じた思考整理を支援できる。
【0115】
ユーザ評価に変えて、単語ベクトルを生成する際のもとになった文書に対する評価値や、他ユーザからの評価など、アイディアのクオリティに関する指標値であれば、どのようなものであっても構わない。
【0116】
さらに、複数ユーザのアイディアベクトルデータベースを統合することもできる。他の人の思考プロセスも情報として取込みアイディア縮約モジュールに学習させることで、他の人の発想にインスパイアされた思考の遷移、つまり、発想転換の支援も可能になる。
【0117】
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0118】
また、上記の各構成・機能・処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード等の記録媒体に置くことができる。
【0119】
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0120】
201 入力データ
211 外側エンコーダ
212 内側エンコーダ
213 潜在空間
214 潜在ベクトル
215 内側デコーダ
216 外側デコーダ
221 出力データ
DB01 アイディア表現データベース
DB02 アイディアベクトルデータベース
DB03 縮約ベクトルデータベース
DB04 候補アイディアデータベース
DB05 モデルデータベース
DB06 パラメータデータベース
M01 候補アイディア生成装置
M02 データ保存装置
M05 ユーザインタフェース
P01 アイディアベクトル化モジュール
P02 アイディア縮約モジュール
P03 縮約空間探索モジュール
P04 候補アイディア生成モジュール
P06 データ管理モジュール
P07 表示部
P08 入力受付部
U111 プロセッサ
U113 通信装置
U114 補助記憶装置
U115 入力装置
U116 モニタ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14A
図14B
図15
図16