(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024179476
(43)【公開日】2024-12-26
(54)【発明の名称】知識データベース生成装置
(51)【国際特許分類】
G06F 16/90 20190101AFI20241219BHJP
G06F 16/28 20190101ALI20241219BHJP
【FI】
G06F16/90 100
G06F16/28
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023098352
(22)【出願日】2023-06-15
(71)【出願人】
【識別番号】000001247
【氏名又は名称】株式会社ジェイテクト
(74)【代理人】
【識別番号】110000648
【氏名又は名称】弁理士法人あいち国際特許事務所
(72)【発明者】
【氏名】小島 大
(72)【発明者】
【氏名】蓮池 正晴
(72)【発明者】
【氏名】東 孝幸
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175EA01
5B175HB03
(57)【要約】
【課題】信頼性が向上された知識データベースを生成可能な知識データベース生成装置を提供する。
【解決手段】演算装置11aと記憶装置11bを含む端末11を含んで構成され、因子30、および因子30間の関係性を表す接続情報40により表現される知識データベースKを生成する知識データベース生成装置10であって、テキストデータTを分析して、テキストデータTに含まれる因子30間の関係性を第1接続情報40aとして抽出するテキストデータ分析部15bと、構造化データSを分析して、構造化データSに含まれる因子30間の関係性を第2接続情報40bとして抽出する構造化データ分析部15cと、第1接続情報40aと、第2接続情報40bと、に基づいて合成接続情報40cを生成し、合成接続情報40cに基づいて知識データベースKを生成する知識データベース生成部15aと、を備える、知識データベース生成装置10。
【選択図】
図1
【特許請求の範囲】
【請求項1】
演算装置と記憶装置を含む端末、またはクラウド上に生成される仮想的な端末を含んで構成され、知識の要素を構成する因子、および前記因子間の関係性を表す接続情報により表現される知識データベースを生成する知識データベース生成装置であって、
事象、および前記事象間の関係性を含むテキストデータを分析して、前記テキストデータに含まれる因子間の関係性を第1接続情報として抽出するテキストデータ分析部と、
構造化データを分析して、前記構造化データに含まれる因子間の関係性を第2接続情報として抽出する構造化データ分析部と、
前記第1接続情報と、前記第2接続情報と、に基づいて合成接続情報を生成し、前記合成接続情報に基づいて、前記因子および前記合成接続情報により表現された前記知識データベースを生成する知識データベース生成部と、を備える、知識データベース生成装置。
【請求項2】
さらに、
前記構造化データに含まれる因子、および前記テキストデータに含まれる前記因子の類似性を判定する類似性判定部を備え、
前記知識データベース生成部は、前記類似性判定部の判定結果に基づいて、前記合成接続情報を生成する、請求項1に記載の知識データベース生成装置。
【請求項3】
前記類似性判定部は、自然言語処理を実行可能なアルゴリズムに基づいて、前記テキストデータに含まれる因子と、前記構造化データに含まれる因子と、の類似性を判定する、請求項2に記載の知識データベース生成装置。
【請求項4】
前記知識データベース生成部は、前記第1接続情報と、前記第2接続情報と、を比較し、前記合成接続情報として、前記第1接続情報と、前記第2接続情報と、前記第1接続情報および前記第2接続情報において互いに共通しない部分と、を含む補完合成接続情報を生成する、請求項1に記載の知識データベース生成装置。
【請求項5】
前記構造化データ分析部は、
前記構造化データと前記第1接続情報とが共通する部分については、因子間の関係性を推定する演算を省略し、
前記構造化データと前記第1接続情報とが共通しない部分についてのみ、因子間の関係性を推定する演算を実行することにより、前記構造化データから、前記第1接続情報と異なる部分的第2接続情報を抽出し、
前記知識データベース生成部は、前記第1接続情報と、前記部分的第2接続情報と、に基づいて前記合成接続情報を生成する、請求項1に記載の知識データベース生成装置。
【請求項6】
前記知識データベース生成部は、前記第1接続情報と、前記第2接続情報と、を比較し、前記合成接続情報として、前記第1接続情報および前記第2接続情報において互いに共通する部分を用いて共通合成接続情報を生成する、請求項1に記載の知識データベース生成装置。
【請求項7】
さらに、
前記合成接続情報を教示する教示手段、または合成接続情報を前記記憶装置に登録する登録手段を有する、請求項1に記載の知識データベース生成装置。
【請求項8】
前記構造化データは、前記因子、および数値データを含む分割表により定義されたデータである、請求項1に記載の知識データベース生成装置。
【請求項9】
前記構造化データは、前記因子、および定性的に表現されたデータにより定義されたデータである、請求項1に記載の知識データベース生成装置。
【請求項10】
前記構造化データは、工作機械の動作に伴って得られたデータを含む、請求項1に記載の知識データベース生成装置。
【請求項11】
前記知識データベースは、前記因子として、工作機械における加工条件の要素および加工結果の要素を含む、請求項1に記載の知識データベース生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、知識データベース生成装置に関する。
【背景技術】
【0002】
従来、工学、医学、農学、生物学などの諸分野における熟練者のノウハウや知識に基づいて、知識データベースを生成することが行われている。このような知識データベースとして、例えば、特許文献1に記載のものが知られている。
【0003】
上記の知識データベースは、対象分野の技術情報のキーワードとなる技術用語を因子として、因子をネットワーク形態で相互接続することによって、対象分野の技術情報の関連性を表現し、対象分野のノウハウや知識を形式知として記憶する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記の知識データベースを生成する際、例えば、公知文献、技術報告書、ノウハウメモ等のテキストデータに基づく場合、テキストデータに記載されている因果関係を作業者が抽出していた。また、実加工データ、実験データ、計測データ等に基づいて知識データベースを作成する場合には、熟練者が上記のデータから、因子間の因果関係の有無を判断していた。また、熟練者のノウハウに基づいて知識データベースを作成する場合には、熟練者の知見と経験とに依存することになる。
【0006】
このように、知識データベースを生成する際、因果関係を抽出する作業が人力に依存していることにより、作業に携わる人によって抽出される因果関係にばらつきが生じるおそれがある。このため、生成された知識データベースの信頼性を十分に向上させることが難しいという問題があった。
【0007】
本発明は、かかる課題に鑑みてなされたものであり、信頼性が向上された知識データベースを生成可能な知識データベース生成装置を提供しようとするものである。
【課題を解決するための手段】
【0008】
本発明の一態様は、
演算装置と記憶装置を含む端末、またはクラウド上に生成される仮想的な端末を含んで構成され、知識の要素を構成する因子、および前記因子間の関係性を表す接続情報により表現される知識データベースを生成する知識データベース生成装置であって、
事象、および前記事象間の関係性を含むテキストデータを分析して、前記テキストデータに含まれる因子間の関係性を第1接続情報として抽出するテキストデータ分析部と、
構造化データを分析して、前記構造化データに含まれる因子間の関係性を第2接続情報として抽出する構造化データ分析部と、
前記第1接続情報と、前記第2接続情報と、に基づいて合成接続情報を生成し、前記合成接続情報に基づいて、前記因子および前記合成接続情報により表現された前記知識データベースを生成する知識データベース生成部と、を備える、知識データベース生成装置にある。
【発明の効果】
【0009】
本発明の一態様によれば、人力によらず、テキストデータ分析部によって、テキストデータから第1接続情報を抽出することができる。また、人力によらず、構造化データ分析部によって、構造化データから第2接続情報を抽出することができる。さらに、人力によらず、知識データベース生成部によって、第1接続情報と、第2接続情報と、に基づいて合成接続情報を生成し、合成接続情報に基づいて、因子および合成接続情報に表現された知識データベースを生成することができる。これにより、構造化データの分析、およびテキストデータの分析を人力のみで行う場合に比べて、信頼性の高い知識データベースを生成することができる。
【0010】
以上のごとく、上記態様によれば、信頼性が向上された知識データベースを生成可能な知識データベース生成装置を提供することができる。
【図面の簡単な説明】
【0011】
【
図1】実施形態1の知識データベース生成装置の構成を示すブロック図。
【
図2】実施形態1の知識データベース生成装置の端末の構成を示すブロック図。
【
図3】実施形態1の知識データベースにおける、因子と接続情報とを説明するための図。
【
図4】実施形態1の知識データベースをネットワーク形態で表現した知識ネットワーク図。
【
図5】実施形態1における、知識データベースの生成工程を説明するための図であって、(a)は、テキストデータから第1接続情報を抽出する工程の図であり、(b)は、構造化データから第2接続情報を抽出する工程の図であり、(c)は、因子と、生成された補完合成接続情報と、を示す図である。
【
図6】実施形態1の知識データベース生成装置の動作を示すフローチャート。
【
図7】実施形態2における、知識データベースの生成工程を説明するための図であって、(a)は、テキストデータから第1接続情報を抽出する工程の図であり、(b)は、構造化データから第2接続情報を抽出する工程の図であり、(c)は、因子と、生成された共通合成接続情報と、を示す図である。
【
図8】実施形態3における、知識データベースの生成工程を説明するための図であって、(a)は、テキストデータから第1接続情報を抽出する工程の図であり、(b)は、構造化データから部分的第2接続情報を抽出する工程の図であり、(c)は、因子と、生成された合成接続情報と、を示す図である。
【発明を実施するための形態】
【0012】
(実施形態1)
1.知識データベース生成装置10の構成
実施形態1の知識データベース生成装置10の構成について
図1~
図2を参照して説明する。知識データベース生成装置10は、知識の要素を構成する因子30、および因子30間の関係性を表す接続情報40により表現される知識データベースKを生成する。知識データベース生成装置10は、工学、医学、農学、生物学などの諸分野に適用される。本形態に係る知識データベース生成装置10は、工作物を加工する機械加工分野に適用される。機械加工分野には、例えば、切削加工、研削加工、放電加工、プレス加工などが含まれる。本形態に係る知識データベース生成装置10は、機械加工分野において、熟練者による技術情報に関する知識を記述した知識データベースKを活用する装置である。
【0013】
図1に示すように、知識データベース生成装置10は端末11と、入力装置12(登録手段の一例)と、教示装置13(教示手段の一例)と、を備える。知識データベース生成装置10はクラウドCに接続されており、クラウドCに接続された工作機械14とネットワークを構成する。クラウドCには、1つ、または複数の工作機械14が接続される。知識データベース生成装置10は、クラウドC上に生成される仮想的な端末(図示せず)を含む構成としても良い。複数の工作機械14と知識データベース生成装置10とは、相互に通信可能に構成されている。工作機械14は、例えば、研削盤、旋盤、マシニングセンタ、フライス盤、歯車加工機、ボーリング加工機などである。
【0014】
端末11は、演算装置11aと記憶装置11bと、を備える。端末11には、入力装置12と、教示装置13と、が接続されている。端末11には、入力装置12および教示装置13と異なる装置が接続される構成としても良い。
【0015】
入力装置12は、キーボード、マウス、タッチパネル、音声入力装置等の、公知の入力装置12である。入力装置12を介して、作業者は、端末11に情報を入力する。
【0016】
教示装置13は、液晶ディスプレイ、タブレット端末、プリンタ等の、公知の教示装置13である。教示装置13を介して、作業者は、端末11から情報を取得する。
【0017】
図2に示すように、記憶装置11bは、知識データベースK、テキストデータT、構造化データS、自然言語処理アルゴリズムAL、および種々のプログラムP等を格納する。記憶装置11bには、上記以外のデータが格納されていても良い。
【0018】
2.知識データベースKについて
図3および
図4を参照して知識データベースKについて説明する。一般に、機械加工分野においては、作業者は、工作物の材質、工具の材質、工作物の品質、加工サイクルタイムなどの種々の情報を考慮して、加工条件としての切削速度や単位時間当たりの切込量などを決定する。この場合、作業者が種々の入力情報を取得して加工条件を決定するに際して、作業者の思考過程をデータベース化したものが、知識データベースKである。
【0019】
つまり、知識データベースKは、工作物の材質、工具の材質、工作物の品質、加工サイクルタイム、切削速度、切込量などに加えて、作業者の思考過程において登場する産業技術要素のそれぞれを因子30として定義され、因子30同士の関係性が定義されている。
【0020】
図3に示すように、ある因子30と、他の因子30と、の関係性は、接続情報40により表現される。接続情報40としては特に限定されず、例えば、ある因子30と他の因子30との間に因果関係を有する場合や、ある因子30と他の因子30とが上位概念と下位概念の関係にある場合であっても良い。
【0021】
図3には、
図3における左側の因子30がサイクルタイムであり、右側の因子30が送り速度である場合における接続情報40が例示されている。接続情報40は、
図3の例では、「サイクルタイム」のランク値と、「送り速度」のランク値の対応関係によって接続情報40が定義されている。この対応関係を参照することによって、「サイクルタイム」のランク値から「送り速度」のランク値を導くことができる。また、「サイクルタイム」と「送り速度」との関係性は、レンジ値によって表現されていても良い。なお、ランク表記とは度量衡を何段階かのランク値で表記することを意味する。レンジ表記とは度量衡の値を任意の幅で区分し、区分した範囲をレンジ値で代表して表記することを意味する。そして、ランク値にはランク指標が別途定義されても良い。
【0022】
知識データベースKは、概念としては、ネットワーク形態で表現される。知識データベースKをネットワーク形態で表現した知識ネットワーク
図Nの例について、
図4を参照して説明する。つまり、知識ネットワーク
図Nは、知識データベースKをグラフィカルに表現したものである。本形態では、機械加工分野における知識データベースKに関する知識ネットワーク
図Nを例に挙げる。
【0023】
図4に示すように、知識ネットワーク
図Nは、複数のノード図形21と、ノード図形21同士を繋ぐリンク図形22とを備える。本形態では、ノード図形21は、四角形で囲まれた文字で表されている。本形態では、リンク図形22は、直線にて表されている。ただし、リンク図形22は、因子30同士の定義の方向性を表すために矢印線で記載されてもよい。ノード図形21は、知識データベースKにおいて、産業技術用語により定義される因子30を表す。
【0024】
複数の因子30間の関係性は、技術的な包含関係(上下関係、主従関係とも称する)である場合と、技術的な異種依存関係である場合とが存在する。
【0025】
例えば、機械諸元は、剛性、機械制度、追従性および動作速度を包含する関係となる。つまり、技術的な包含関係を有する因子30として、機械諸元を上位概念因子とし、剛性、機械制度、追従性および動作速度を下位概念因子とする。ただし、機械諸元に上記以外の因子30が含まれる構成としてもよい。
【0026】
技術的に異種依存関係を有する因子30として、例えば、「剛性」と「サイクルタイム」がある。以下において、技術的な包含関係を有する2つの因子30の関係性を、単に包含関係と称し、技術的な異種依存関係を有する2つの因子30の関係性を、単に異種依存関係と称し、特に区別しない場合には、単に接続関係と称する。
【0027】
リンク図形22は、ノード図形21同士の関係性を表す。リンク図形22は、知識データベースKにおいて、因子30同士の関係性を表す。
【0028】
3.記憶装置11bに格納されたデータ等について
テキストデータTは、公知文献、技術報告書、ノウハウメモ等、文章により表現されたデータである。テキストデータTは、事象、および事象間の関係性を含む。
【0029】
構造化データSは、例えば、因子30、および数値データにより定義されたデータである。構造化データSは、例えば、因子30、および数値データを含む分割表31aにより定義することができる。分割表31aとは、複数のカテゴリカルデータを組み合わせて度数を集計した表である。カテゴリカルデータとは、離散変数により構成されるデータである。
図3に、接続関係を示す分割表31aを例示する。さらに、数値データとしては、例えば、クーラントの量の程度を表現したデータとすることもできる。この場合、例えば、分割表において、特定のセルに、クーラントの流量のレンジ値またはランク値が記載される構成としても良い。
【0030】
また、構造化データSは、因子30、および定性的に表現されたデータにより定義されたデータとしても良い。定性的に表現されたデータとしては、例えば、クーラントが工作物に向けて吐出されているか否かというデータや、スイッチがONになっているかOFFになっているかというデータ等が挙げられる。このような構造化データSは、例えば、分割表において、特定のセルが、「1」または「0」と表示されることにより表現される。また、例えば、スイッチが複数(例えば4つ)の接点を有する場合には、分割表において、特定のセルに「1」~「4」のいずれかが記載されることにより表現される構成としても良い。
【0031】
ただし、構造化データSは、知識データベース生成装置10に接続された工作機械14の動作に伴って得られたデータを含む。また、上記した知識データベースKは、因子30として、工作機械14における加工条件の要素および加工結果の要素を含む。
【0032】
自然言語処理アルゴリズムALは、自然言語を処理可能なアルゴリズムであって、例えば、Word2Vec、Doc2vec、BERT、XLNet、RoBERTa、ALBERT、fastText、SCDV、GNMT、Transformer、ELMo、GPT、GPT-2等、任意のアルゴリズムを適宜に選択できる。上記の自然言語処理アルゴリズムALにより、得られる単語の分散表現(ベクトル)を用いて、類似度の高い用語を同義語とみなして因子30を統一することができる。
【0033】
プログラムPは、演算装置11aを動作させるための複数のプログラムPである。プログラムPは、演算装置11aを、知識データベース生成部15aとして動作させるプログラムP、テキストデータ分析部15bとして動作させるプログラムP、構造化データ分析部15cとして動作させるプログラムP、および類似性判定部15dとして動作させるプログラムP等を含む。ただし、プログラムPは、上記以外のプログラムPを含んでも良い。
【0034】
4.演算装置11aについて
図2に示すように、演算装置11aは、記憶装置11bに格納されたプログラムPに基づいて動作することにより、知識データベース生成部15a、テキストデータ分析部15b、構造化データ分析部15c、および類似性判定部15dとして機能する。
【0035】
図5(a)を参照して、テキストデータ分析部15bについて説明する。テキストデータ分析部15bは、テキストデータTを分析して、テキストデータTに含まれる因子30間の関係性を第1接続情報40aとして抽出する。
【0036】
まず、テキストデータ分析部15bは、記憶装置11bからテキストデータTを取得する。例えば、「因子Aによって因子Cが上昇し、因子Fが低下する。」という文を取得する。「因子A」、「因子C」および「因子F」としては、「サイクルタイム」、「送り速度」、「真円度」等の具体的な技術用語である因子30が用いられる。
【0037】
次に、テキストデータ分析部15bは、取得したテキストデータTから、複数の因子30(例えば、「因子A」、「因子C」および「因子F」)を抽出する。
図5(a)において、円で囲まれた[A]、「C」および「F」が、抽出された因子30を表す。
【0038】
次に、テキストデータ分析部15bは、因子30間の関係性を、第1接続情報40aとして表現する。上記の例でいえば、「因子A」が原因となって「因子C」が上昇するという結果が生じ、「因子C」の上昇が原因となって「因子F」の効果という結果が生じたと分析する。この第1接続情報40aを、「因子A」から「因子C」への論理の流れとして表現するとともに、「因子C」から「因子F」への論理の流れとして表現する。
図5(a)には、円で囲まれた「A」、「C」および「F」が矢印で接続されている。矢印の向きが、論理の流れの方向を示す。
【0039】
続いて、
図5(b)を参照して、構造化データ分析部15cについて説明する。構造化データ分析部15cは、構造化データSを分析して、構造化データSに含まれる因子30間の関係性を第2接続情報40bとして抽出する。
【0040】
構造化データ分析部15cは、データベースから構造化データSを取得する。上記したように、構造化データSは、因子30、および数値データを含む分割表31bにより定義されたデータである。
図5(b)に分割表31bの一例を示す。分割表31bの上段には、B、D、E、FおよびGのアルファベットが記載されている。各アルファベットは、それぞれ、「因子B」、「因子D」、「因子E」、「因子F」および「因子G」を表す。なお、以下の説明において、第1接続情報40aと、第2接続情報40bとを区別しない場合、接続情報40と記載する場合がある。
【0041】
構造化データ分析部15cは、「因子B」、「因子D」、「因子E」、「因子F」および「因子G」のそれぞれの間についての関係性を推論する演算を行う。構造化データ分析部15cは、演算の結果に基づいて、「因子B」、「因子D」、「因子E」、「因子F」および「因子G」のそれぞれの間の関係性を表現する第2接続情報40bを推定する。
図5(b)に、円で囲まれた「B」、「D」、「E」、「F」および「G」は因子30を表し、因子30同士を接続する矢印は接続関係が存在することを表し、矢印の向きは、論理の流れの方向を示す。
図5(b)には、「因子B」と「因子E」との間に因果関係があり、「因子D」と「因子E」との間に因果関係があり、「因子E」と「因子F」との間に因果関係があり、「因子E」と「因子G」との間に因果関係がある例が表現されている。
【0042】
続いて、
図5(a)~(c)を参照して、知識データベース生成部15aについて説明する。知識データベース生成部15aは、テキストデータTから抽出された第1接続情報40aと、構造化データSから抽出された第2接続情報40bと、に基づいて合成接続情報40cを生成する。知識データベース生成部15aは、合成接続情報40cに基づいて、因子30、および合成接続情報40cにより表現された知識データベースKを生成する。
【0043】
本形態の知識データベース生成部15aは、テキストデータTから抽出された第1接続情報40aと、構造化データSから抽出された第2接続情報40bと、を比較する。その結果、知識データベース生成部15aは、第1接続情報40aおよび第2接続情報40bにおいて互いに共通しない部分を抽出する。知識データ生成部は、合成接続情報40cとして、第1接続情報40aと、第2接続情報40bと、第1接続情報40aおよび第2接続情報40bにおいて互いに共通しない部分と、を含む補完合成接続情報40dを生成する(
図5(c)参照)。
【0044】
図5(a)に示すように、テキストデータTから抽出された第1接続情報40aとして、「因子A」、「因子C」および「因子F」に関する関係性が抽出されている。また、
図5(b)に示すように、構造化データSから抽出された第2接続情報40bとして、「因子B」、「因子D」、「因子E」、「因子F」および「因子G」に関する関係性が抽出されている。
【0045】
第1接続情報40aから見ると、第2接続情報40bは、「因子B」、「因子D」、「因子E」および「因子G」が共通でない。一方、第2接続情報40bから見ると、「因子A」および「因子C」が共通でない。
【0046】
本形態の知識データベース生成部15aは、互いに共通しない部分を合成して、
図5(c)に示すように、「因子A」、「因子B」、「因子C」、「因子D」、「因子E」、「因子F」および「因子G」に係る補完合成接続情報40dを生成する。本形態においては、第1接続情報40aと、第2接続情報40bとが、互いに共通する「因子F」によって結び付けられている。
【0047】
ただし、第1接続情報40aと、第2接続情報40bとにおいて、どの因子30が共通するか、また、どの因子30が共通しないかについては任意である。また、補完合成接続情報40dが、第1接続情報40aと第2接続情報40bにおいて互いに共通しない部分をどのように結びづけるかについても任意である。
【0048】
類似性判定部15dは、テキストデータTに含まれる因子30と、構造化データSに含まれる因子30と、の類似性を判定する。類似性を判定する手法は特に限定されず、例えば、自然言語処理を実行可能な自然言語処理アルゴリズムALに基づいて類似性を判定しても良いし、予め記憶装置11bに類似する因子30を同義語とする辞書を格納しておき、この辞書に基づいて類似性を判定しても良い。ただし、類似性判定部15dは省略しても良い。
【0049】
知識データベース生成部15aは、類似性判定部15dの判定結果に基づいて、合成接続情報40cを生成する。以下に、具体的に説明する。
【0050】
例えば、テキストデータTまたは構造化データSから、「表面粗さ」、「面粗さ」、「面粗度」、「面粗」、および「粗さ」という因子30が抽出されたとする。この場合において、類似性判定部15dにより、上記の「表面粗さ」、「面粗さ」、「面粗度」、「面粗」、および「粗さ」が類似すると判定されたとする。類似性判定部15dは、例えば、「表面粗さ」、「面粗さ」、「面粗度」、「面粗」、および「粗さ」の因子30を、すべて、「表面粗さ」として統一して表記することを決定する。ただし、類似する複数の因子30のうち、どの因子30によって統一して表記するかは任意である。また、類似する複数の因子30と異なる統一的な語句によって表記しても良い。
【0051】
知識データベース生成部15aは、「表面粗さ」、「面粗さ」、「面粗度」、「面粗」、および「粗さ」の因子30に関する接続情報40を、「表面粗さ」に関する接続情報40として統一して表記することにより、合成接続情報40cを生成する。
【0052】
5.知識データベース生成装置10の動作
続いて、知識データベース生成装置10の動作について、
図2および
図6を参照しつつ説明する。
図6に、知識データベース生成装置10の動作のメインフローを示す。知識データベース生成装置10の動作は以下の記載に限定されない。
【0053】
知識データベース生成装置10が起動されると、第1接続情報40aが抽出される処理が実行される(S1)。まず、S1において、テキストデータ分析部15bは、記憶装置11bからテキストデータTを取得する(
図2参照)。テキストデータ分析部15bは、テキストデータTから、複数の因子30を抽出する。
【0054】
図2に示すように、類似性判定部15dは、記憶装置11bから自然言語処理アルゴリズムALを取得する。類似性判定部15dは、テキストデータ分析部15bが抽出した複数の因子30の類似性を判定する。類似性判定部15dは、類似すると判定した複数の因子30を統一的に表示する因子30を決定する。
【0055】
テキストデータ分析部15bは、統一的に表示された複数の因子30間の関係性を推定するための演算を実行する。テキストデータ分析部15bは、因子30間の関係性を表す第1接続情報40aを生成する。
【0056】
ただし、因子30間の関係性は、以下のように推定しても良い。すなわち、まず、テキストデータ分析部15bは、テキストデータTから複数の因子30を抽出し、因子30間の関係性を推定するための演算を実行する。これにより、テキストデータ分析部15bは、因子30間の関係性を推定する。次に、類似性判定部15dは、記憶装置11bから自然言語処理アルゴリズムALを取得する。類似性判定部15dは、複数の因子30の類似性を判定する。類似性判定部15dは、類似すると判定した複数の因子30を統一的に表示する因子30を決定する。さらに、テキストデータ分析部15bは、統一的に表示された因子30に基づいて、因子30間の関係性を表す第1接続情報40aを生成する。
【0057】
次に、第2接続情報40bが生成される処理が実行される(S2)。S2において、構造化データ分析部15cは、記憶装置11bから構造化データSを取得する(
図2参照)。構造化データ分析部15cは、構造化データSから、複数の因子30を抽出する。
【0058】
ただし、第1接続情報40aと、第2接続情報40bを生成する順序は特に限定されず、第1接続情報40aを、第2接続情報40bを生成した後に生成する構成としても良い。
【0059】
類似性判定部15dは、構造化データ分析部15cが抽出した複数の因子30の類似性を判定する。類似性判定部15dは、類似すると判定した複数の因子30を統一的に表示する因子30を決定する。
【0060】
構造化データ分析部15cは、統一的に表示された因子30間の関係性を推定するための演算を実行する。構造化データ分析部15cは、因子30間の関係性を表す第2接続情報40bを生成する。
【0061】
次に、合成接続情報40cが生成される処理が実行される(S3)。知識データベース生成部15aは、テキストデータ分析部15bから、テキストデータTから抽出された因子30と、これらの因子30間の関係性を表す第1接続情報40aを取得する(
図2参照)。また、知識データベース生成部15aは、構造化データ分析部15cから、構造化データSから抽出された因子30と、これらの因子30間の関係性を表す第2接続情報40bを取得する。
【0062】
知識データベース生成部15aは、第1接続情報40aと、第2接続情報40bと、を比較する。その結果、知識データベース生成部15aは、第1接続情報40aおよび第2接続情報40bにおいて互いに共通しない部分を抽出する。知識データベース生成部15aは、合成接続情報40cとして、第1接続情報40aと、第2接続情報40bと、第1接続情報40aおよび第2接続情報40bにおいて互いに共通しない部分と、を含む補完合成接続情報40dを生成する。
【0063】
知識データベース生成部15aは、テキストデータTから抽出された因子30と、構造化データSから抽出された因子30と、補完合成接続情報40dと、に基づいて、知識データベースKを生成する。
【0064】
次に、教示装置13は、生成された知識データベースKを作業者に教示する(S4)。教示装置13の一例である液晶ディスプレイに知識データベースKが表示されることにより、または、教示装置13の一例であるプリンタにより知識データベースKが印刷されることにより、作業者は知識データベースKを、知識データベース生成装置10から教示される。
【0065】
次に、作業者は、入力装置12を介して、生成された知識データベースKを、記憶装置11bに格納させる指令を、端末11に入力する(S5)。これにより、知識データベースKは、記憶装置11bに格納され、登録される。
【0066】
以上により、知識データベース生成装置10の動作が終了する。
【0067】
6.本形態の作用効果
続いて、本形態の作用効果について説明する。本形態に係る知識データベース生成装置10は、演算装置11aと記憶装置11bを含む端末11、またはクラウドC上に生成される仮想的な端末を含んで構成され、知識の要素を構成する因子30、および因子30間の関係性を表す接続情報40により表現される知識データベースKを生成する。知識データベース生成装置10は、テキストデータ分析部15bと、構造化データ分析部15cと、知識データベース生成部15aと、を備える。テキストデータ分析部15bは、事象、および事象間の関係性を含むテキストデータTを分析して、テキストデータTに含まれる因子30間の関係性を第1接続情報40aとして抽出する。構造化データ分析部15cは、構造化データSを分析して、構造化データSに含まれる因子30間の関係性を第2接続情報40bとして抽出する。知識データベース生成部15aは、構造化データ分析部15cと、第1接続情報40aと、第2接続情報40bと、に基づいて合成接続情報40cを生成し、合成接続情報40cに基づいて、因子30および合成接続情報40cにより表現された知識データベースKを生成する。
【0068】
本形態によれば、人力によらず、テキストデータ分析部15bによって、テキストデータTから第1接続情報40aを抽出することができる。また、人力によらず、構造化データ分析部15cによって、構造化データSから第2接続情報40bを抽出することができる。さらに、人力によらず、知識データベース生成部15aによって、第1接続情報40aと、第2接続情報40bと、に基づいて合成接続情報40cを生成し、合成接続情報40cに基づいて、因子30および合成接続情報40cに表現された知識データベースKを生成することができる。これにより、構造化データSの分析、およびテキストデータTの分析を人力で行う場合に比べて、信頼性の高い知識データベースKを生成することができる。
【0069】
知識データベース生成部15aは、さらに、構造化データSに含まれる因子30と、テキストデータTに含まれる因子30と、の類似性を判定する類似性判定部15dを備える。知識データベース生成部15aは、類似性判定部15dの判定結果に基づいて、合成接続情報40cを生成する。これにより、知識データベース生成部15aは、構造化データSに含まれる因子30と、テキストデータTに含まれる因子30とが類似する場合には、両者を同じとみなして合成接続情報40cを生成する。この結果、より多くのデータまたは因子30に基づいて合成接続情報40cを生成することができるので、知識データベースKの信頼性を向上させることができる。
【0070】
本形態に係る類似性判定部15dは、自然言語処理を実行可能な自然言語処理アルゴリズムALに基づいて、テキストデータTに含まれる因子30、および構造化データSに含まれる因子30の類似性を判定する。これにより、因子30を表現する単語の分散表現が得られ、単語の分散表現に基づいて、因子30同士の類似性を判定することができる。これにより、知識データベースKの精度を向上させることができる。類似性の判断は、テキストデータTに含まれる因子30間の類似性を判断することを含むとともに、構造化データSに含まれる因子30間の類似性を判断することを含む。さらに、テキストデータTに含まれる因子30と、構造化データSに含まれる因子30との間の類似性を判断することも含む。
【0071】
本形態に係る知識データベース生成部15aは、第1接続情報40aと、第2接続情報40bと、を比較し、合成接続情報40cとして、第1接続情報40aと、第2接続情報40bと、第1接続情報40aおよび第2接続情報40bにおいて互いに共通しない部分と、を含む補完合成接続情報40dを生成する。これにより、第1接続情報40aおよび第2接続情報40bにおいて互いに共通しない部分を補完することができるので、知識データベースKの信頼性を向上させることができる。
【0072】
知識データベース生成装置10は、さらに、合成接続情報40cを教示する教示装置13を有する。これにより、作業者は生成された知識データベースKを知得することができる。また、知識データベース生成装置10は、合成接続情報40cを記憶装置11bに登録する入力装置12を有する。これにより、作業者は、生成された知識データベースKを記憶装置11bに登録することができる。
【0073】
本形態に係る構造化データSは、工作機械14の動作に伴って得られたデータを含む。これにより、工作機械14から、ネットワークを介して、構造化データSを取得することができる。
【0074】
本形態に係る知識データベースKは、因子30として、工作機械14における加工条件の要素および加工結果の要素を含む。本発明は、工作機械14に効果的に適用することができる。
【0075】
(実施形態2)
次に、
図7を参照して、実施形態2について説明する。本形態に係る知識データベース生成部15aは、第1接続情報40aと、第2接続情報40bと、を比較し、合成接続情報40cとして、第1接続情報40aおよび第2接続情報40bにおいて互いに共通する部分を用いて共通合成接続情報40eを生成する。以下に説明する。
【0076】
図7(a)に示すように、テキストデータ分析部15bは、テキストデータTを分析して、テキストデータTに含まれる因子30間の関係性を第1接続情報40aとして抽出する。本形態に係るテキストデータ分析部15bは、実施形態1と同様なので、重複する説明を省略する。本形態においては、「因子A」、「因子C」、「因子F」および「因子H」が抽出され、第1接続情報40aとして、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性と、「因子C」→「因子H」で表される論理の流れに関する関係性と、が抽出された。
【0077】
次に、構造化データ分析部15cは、構造化データSに係る分割表31cから、第2接続情報40bを抽出する。分割表31cの上段には、A~Gのアルファベットが記載されている。各アルファベットは、それぞれ、「因子A」~「因子G」を表す。
【0078】
構造化データ分析部15cは、「因子A~「因子G」のそれぞれの間についての関係性を推論する演算を行う。構造化データ分析部15cは、演算の結果に基づいて、「因子A」~「因子G」のそれぞれの間の関係性を表現する第2接続情報40bを推定する。
図5(b)に、円で囲まれた「A」、「B」、「C」、「D」、「E」、「F」および「G」は因子30を表し、因子30同士を接続する矢印は接続関係が存在することを表し、矢印の向きは、論理の流れの方向を示す。
【0079】
図7(b)には、「因子A」と「因子C」との間に因果関係があり、「因子C」と「因子F」との間に因果関係があるとともに、「因子B」と「因子E」との間に因果関係があり、「因子D」と「因子E」との間に因果関係があり、「因子E」と「因子F」との間に因果関係があり、「因子E」と「因子G」との間に因果関係がある例が表現されている。第2接続情報40bとして抽出された、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性は、第1接続情報40aと共通している。
【0080】
ただし、第1接続情報40aと、第2接続情報40bを生成する順序は特に限定されず、第1接続情報40aを、第2接続情報40bを生成した後に生成する構成としても良い。
【0081】
次に、
図7(c)に示すように、知識データベース生成部15aは、第1接続情報40aと、第2接続情報40bとの間で共通する、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性を抽出して、合成接続情報40cとして共通合成接続情報40eを生成する。
【0082】
本形態によれば、共通する接続情報40に基づいて共通合成接続情報40eを生成することができるので、知識データベースKの信頼性を向上させることができる。
【0083】
なお、実施形態2以降において用いた符号のうち、既出の実施形態において用いた符号と同一のものは、特に示さない限り、既出の実施形態におけるものと同様の構成要素等を表す。
【0084】
(実施形態3)
次に、
図8を参照して実施形態3について説明する。本形態に係る構造化データ分析部15cは、構造化データSと第1接続情報40aとが共通する部分については、因子30間の関係性を推定する演算を省略し、構造化データSと第1接続情報40aとが共通しない部分についてのみ因子30間の関係性を推定する演算を実行することにより、構造化データSから、第1接続情報40aと異なる部分的第2接続情報40fを抽出する。知識データベース生成部15aは、第1接続情報40aと、部分的第2接続情報40fと、に基づいて合成接続情報40cを生成する。以下に説明する。
【0085】
図8(a)に示すように、テキストデータ分析部15bは、テキストデータTを分析して、テキストデータTに含まれる因子30間の関係性を第1接続情報40aとして抽出する。本形態に係るテキストデータ分析部15bは、実施形態1と同様なので、重複する説明を省略する。本形態においては、「因子A」、「因子C」および「因子F」が抽出され、第1接続情報40aとして、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性が抽出された。
【0086】
次に、構造化データ分析部15cは、第1接続情報40aに係る「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性については、構造化データSにおいて関係性を推定する演算を省略する。すなわち、本形態においては、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性が構造化データSに含まれているか否かについて演算を実行しない。このため、構造化データSに、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性が、構造化データSに含まれている可能性もあるし、また、含まれていない可能性もある。
図8(b)において、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性については、破線で記載されている。これは、本形態においては、構造化データSに、「因子A」→「因子C」→「因子F」で表される論理の流れに関する関係性が含まれているか否かについては不明であるからである。
【0087】
図8(b)に示すように、構造化データ分析部15cは、構造化データSに係る分割表31bから、部分的第2接続情報40fとして、「因子B」、「因子D」、「因子E」、「因子F」および「因子G」に関する関係性を抽出する。
【0088】
次に、
図8(c)に示すように、知識データベース生成部15aは、第1接続情報40aと、部分的第2接続情報40fとを、「因子F」によって結び付けることにより、合成接続情報40cを生成する。
【0089】
本形態によれば、構造化データSにおける因子30間の因果関係を推定するための演算時間を短縮できる。
【0090】
本発明は上記各実施形態に限定されるものではなく、その要旨を逸脱しない範囲において種々の実施形態に適用することが可能である。
【0091】
実施形態3においては、構造化データSから部分的第2接続情報40fを抽出し、第1接続情報40aと部分的第2接続情報40fから合成接続情報40cを生成する構成としたが、これに限られず、テキストデータ分析部15bは、テキストデータTと第2接続情報40bとが共通する部分については、因子30間の関係性を推定する演算を省略し、テキストデータTと第2接続情報40bとが共通しない部分についてのみ、因子30間の関係性を推定する演算を実行することにより、テキストデータTから、第2接続情報40bと異なる部分的第1接続情報を抽出し、知識データベース生成部15aは、部分的第1接続情報と、第2接続情報40bと、に基づいて合成接続情報40cを生成する構成としても良い。
【0092】
本発明は上記各実施形態に限定されるものではなく、その要旨を逸脱しない範囲において種々の実施形態に適用することが可能である。
【0093】
知識データベース生成装置10は、工作機械14に組込まれた構成としても良い。
【0094】
本形態に係る知識データベース生成装置10においては、知識データベースKを生成する際、作業者による作業が不要である構成としたが、これに限られず、部分的に作業者が作業を行っても良い。例えば、下記のように作業を行うことができる。すなわち、類似性判定部15dは、分散表現をもとに類似度を算出し、算出された類似度のスコアの昇順または降順に因子30を並べ、教示装置13に表示させる。作業者は、教示装置13に表示された因子30について、類似語を選択し、入力装置12を介して端末11に統一された類似語を指示する。知識データベース生成部15aは、指示された類似語に基づいて、合成接続情報40cを生成する。
【符号の説明】
【0095】
10:知識データベース生成装置、11:端末、11a:演算装置、11b:記憶装置、12:入力装置、13:教示装置、14:工作機械、15a:知識データベース生成部、15b:テキストデータ分析部、15c:構造化データ分析部、15d:類似性判定部、30:因子、31a,31b:分割表、40:接続情報、40a:第1接続情報、40b:第2接続情報、40c:合成接続情報、40d:補完合成接続情報、40e:共通合成接続情報、40f:部分的第2接続情報、AL:自然言語処理アルゴリズム、C:クラウド、K:知識データベース、S:構造化データ、T:テキストデータ