IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

7633015解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム
<>
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図1
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図2
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図3
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図4
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図5
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図6
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図7
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図8
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図9
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図10
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図11
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図12
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図13
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図14
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図15
  • -解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-10
(45)【発行日】2025-02-19
(54)【発明の名称】解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システム
(51)【国際特許分類】
   G06F 16/35 20250101AFI20250212BHJP
   G06F 16/383 20190101ALI20250212BHJP
【FI】
G06F16/35
G06F16/383
【請求項の数】 7
(21)【出願番号】P 2020181438
(22)【出願日】2020-10-29
(65)【公開番号】P2021093140
(43)【公開日】2021-06-17
【審査請求日】2023-10-18
(31)【優先権主張番号】P 2019218724
(32)【優先日】2019-12-03
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(74)【代理人】
【識別番号】110004026
【氏名又は名称】弁理士法人iX
(72)【発明者】
【氏名】王 明涛
(72)【発明者】
【氏名】本窪田 昌也
【審査官】早川 学
(56)【参考文献】
【文献】国際公開第2016/103451(WO,A1)
【文献】特開2002-230005(JP,A)
【文献】特開2012-247869(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 40/00-40/58
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータで実行され、
新規課題を取得する工程と、
複数の過去課題のそれぞれに対応する課題タグが相互の関連性に応じて複数のカテゴリに分類された教師データで学習済みの分類モデルを用いて、複数の前記カテゴリのうち前記新規課題が分類されるカテゴリを推定する工程と、
推定された前記カテゴリ内において複数の前記過去課題のうち前記新規課題と類似する過去課題を検索する工程と、
検索された前記類似する過去課題に紐づいた解決手段を出力する工程と、
を備え、
それぞれの前記過去課題は、課題項目及び手段項目が階層構造をなすように配置された少なくとも1つの階層データ内において、いずれかの前記課題項目に入力されており、
それぞれの前記課題タグは、それぞれの前記過去課題、及び、前記階層データ内において、それぞれの前記過去課題が入力された前記課題項目と親子関係にある項目に入力された情報に基づいて決定されている解決手段の提案方法。
【請求項2】
それぞれの前記課題タグは、それぞれの前記過去課題の文章と、前記親子関係にある項目に入力された文章と、から抽出される単語及び前記単語の同義語に基づいて決定されている請求項1に記載の解決手段の提案方法。
【請求項3】
前記教師データにおいて、複数の前記課題タグは、オントロジーを用いて複数の前記カテゴリに分類されている請求項1または2に記載の解決手段の提案方法。
【請求項4】
前記カテゴリを推定する工程は、
前記新規課題の文章から位置をずらして複数の部分語を切り出す工程と、
前記分類モデルに複数の前記部分語を入力し、前記分類モデルにそれぞれの前記部分語とそれぞれの前記カテゴリとの関連度を出力させる工程と、
前記関連度に基づき、複数の前記カテゴリのうち前記新規課題が分類される前記カテゴリを推定する工程と、
を有する請求項1~3のいずれか1つに記載の解決手段の提案方法。
【請求項5】
複数の前記階層データは、複数のドメインから提供されたものであり、
前記教師データにおいて、それぞれの前記カテゴリには、複数の前記ドメインを横断した統一の概念でまとめることのできる複数の前記課題タグが属している請求項1~4のいずれか1つに記載の解決手段の提案方法。
【請求項6】
コンピュータで実行され、
複数の過去課題のそれぞれに対応する課題タグを決定する工程と、
複数の前記課題タグが相互の関連性に応じて複数のカテゴリに分類された教師データを作成する工程と、
前記教師データを用いて、複数の前記カテゴリのうち新規課題が分類されるカテゴリを推定する分類モデルを生成する工程と、
を備え、
それぞれの前記過去課題は、課題項目及び手段項目が階層構造をなすように配置された少なくとも1つの階層データ内において、前記課題項目に入力されており、
それぞれの前記課題タグを、それぞれの前記過去課題、及び、前記階層データ内において、それぞれの前記過去課題が入力された前記課題項目と親子関係にある項目に入力された情報に基づいて決定する分類モデルの生成方法。
【請求項7】
新規課題の入力を受け付ける入力部と、
複数の過去課題のそれぞれに対応する課題タグが相互の関連性に応じて複数のカテゴリに分類された教師データで学習済みの分類モデルを用いて、複数の前記カテゴリのうち前記新規課題が分類されるカテゴリを推定する推定部と、
推定された前記カテゴリ内において、複数の前記過去課題のうち前記新規課題と類似する過去課題を検索する検索部と、
検索された前記類似する過去課題に紐づいた解決手段を出力する出力部と、
を備え、
それぞれの前記過去課題は、課題項目及び手段項目が階層構造をなすように配置された少なくとも1つの階層データ内において、いずれかの前記課題項目に入力されており、
それぞれの前記課題タグは、それぞれの前記過去課題、及び、前記階層データにおいて、それぞれの前記過去課題が入力された前記課題項目と親子関係にある項目に入力された情報に基づいて決定されている解決手段の提案システム。
【発明の詳細な説明】
【技術分野】
【0001】
実施形態は、解決手段の提案方法、分類モデルの生成方法、及び解決手段の提案システムに関する。
【背景技術】
【0002】
従来から、過去課題に解決手段を紐づけたセットデータを蓄積しておき、新規課題の解決手段を検討する際に、蓄積されたセットデータから新規課題に類似する過去課題を検索し、類似する過去課題の解決手段を活用することが試みられている。
しかしながら、過去課題において課題の特徴が十分に表現されておらず、蓄積されたセットデータから新規課題に類似する適切な過去課題を検出できない場合がある。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2000-276487号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
実施形態の目的は、新規課題に類似する適切な過去課題を検出できる解決手段の提案方法及び提案システムと、このような解決手段の提案方法に用いられる分類モデルの生成方法と、を提供することである。
【課題を解決するための手段】
【0005】
実施形態に係る解決手段の提案方法は、新規課題を取得する工程と、複数の過去課題のそれぞれに対応する課題タグが相互の関連性に応じて複数のカテゴリに分類された教師データで学習済みの分類モデルを用いて、複数の前記カテゴリのうち前記新規課題が分類されるカテゴリを推定する工程と、推定された前記カテゴリ内において複数の前記過去課題のうち前記新規課題と類似する過去課題を検索する工程と、検索された前記類似する過去課題に紐づいた解決手段を出力する工程と、を備え、それぞれの前記過去課題は、課題項目及び手段項目が階層構造をなすように配置された少なくとも1つの階層データ内において、いずれかの前記課題項目に入力されており、それぞれの前記課題タグは、それぞれの前記過去課題、及び、前記階層データにおいて、それぞれの前記過去課題が入力された前記課題項目と親子関係にある項目に入力された情報に基づいて決定されている。
【図面の簡単な説明】
【0006】
図1】第1の実施形態に係る解決手段の提案システム及び提案システムに用いられる分類モデルの生成システムを示すブロック図である。
図2】階層データを例示する図である。
図3】第1の実施形態に係る分類モデルの生成方法を示すフローチャートである。
図4】課題タグを決定する方法を示す図である。
図5】課題タグを決定する方法を示す図である。
図6】複数の課題タグを複数のカテゴリに分類する方法を示す図である。
図7】第1の実施形態に係る解決手段の提案方法を示すフローチャートである。
図8】新規課題が分類されるカテゴリを推定する方法を示す図である。
図9】各カテゴリの関連度の最大値を示すグラフである。
図10】類似する過去課題の検索方法を示す図である。
図11】出力を例示する図である。
図12図12(a)は、第2の実施形態に係る解決手段の提案システムにおいて新規課題が分類されるカテゴリの推定方法を示す図であり、図12(b)は、第2の実施形態に係る解決手段の提案システムにおいて複数の過去課題のうち新規課題に類似する過去課題の抽出方法を示す図である。
図13】第2の実施形態に係る解決手段の提案システムの検索条件の設定画面を示す図である。
図14】第2の実施形態に係る解決手段の提案システムの出力を示す図である。
図15】第3の実施形態に係る解決手段の提案システムにおける課題タグの決定方法を示す図である。
図16】第4の実施形態に係る過去データを示す図である。
【発明を実施するための形態】
【0007】
<第1の実施形態>
先ず、第1の実施形態について説明する。
(解決手段の提案システムの概要)
図1は、本実施形態に係る解決手段の提案システム及び提案システムに用いられる分類モデルの生成システムを示すブロック図である。
本実施形態に係る解決手段の提案システム1(以下、単に「提案システム1」という)は、例えば、複数のドメインからなる組織において用いられる。「ドメイン」とは、企業等の組織が事業展開する際の事業領域である。
【0008】
提案システム1は、いずれかのドメインの端末から新規課題i1が入力された場合に、組織内に蓄積された複数の過去課題の中から新規課題i1に類似する過去課題a11を検索し、類似する過去課題a11の解決手段a12を出力する。これにより、各ドメインにおいて新規課題i1の解決手段を検討する際に、ドメインを問わず過去の知見を活用できる。なお、提案システム1は、1つのドメイン内で用いられてもよい。
【0009】
提案システム1は、各ドメインから提供された少なくとも1つの階層データD1(過去データ)、階層データD1を用いて生成システム2によって生成される分類モデルD5及びセットデータD2等を前提としてなり立っている。提案システム1の構成を詳述する前に、先ず、階層データD1及び生成システム2について詳述する。
【0010】
(階層データ)
図2は、階層データを例示する図である。
階層データD1は、過去に技術や製品等の対象を実現する際に検討された知見を、対象を実現する際に生じた課題とその課題を解決可能な手段とにばらし、課題に手段を紐づけたデータである。階層データD1を作成することにより、対象を実現する際に検討された過去の知見を整理することができる。
【0011】
階層データD1では、課題項目a1及び手段項目a2が階層構造をなすように配置されている。「階層構造」とは、上位側から下位側に向かって配列された複数の階層を有し、ある項目Xが配置された階層の直下の階層に、その項目Xを前提とする項目Yを配置し、上位側の項目Xに下位側の項目Yを紐づけた構造を意味する。以下、このようなX項目とY項目の関係を「親子関係」という。また、Y項目から見てX項目を「親項目」といい、X項目から見てY項目を「子項目」という。さらに、Y項目が配置された階層の直下の階層にZ項目が配置され、Y項目にZ項目が紐づけられている場合、X項目から見てZ項目を「孫項目」という。階層データD1を、課題項目a1及び手段項目a2以外にさらに別の項目を含んだ階層構造として構成してもよい。このような場合、階層データD1では、課題項目a1及び手段項目a2を含む複数の項目が階層構造をなすように配置される。
【0012】
図2の例では階層データD1の最上位(根)には、対象項目a0が配置されている。対象項目a0には、例えば、対象となる技術や製品等が入力されている。対象項目a0の子項目は、対象項目a0を実現する際に生じる課題項目a1である。その課題項目a1の子項目は、その課題項目a1を解決可能な手段項目a2、又は、その課題項目a1を複数の下位概念の課題に細分化した別の課題項目a1である。手段項目a2の子項目は、その手段項目a2を採用したときに発生する課題項目a1、又は、その手段項目a2を複数の下位概念の手段に細分化した別の手段項目a2である。
なお、階層データD1において、一つの親項目に複数の子項目が紐づけられている場合、子項目同士の種類は同じである。
【0013】
提案システム1及び生成システム2は、少なくとも1つの階層データD1のいずれかの課題項目a1に入力された課題を「過去課題a11」として取り扱う。
また、提案システム1及び生成システム2は、例えば、過去課題a11が入力された課題項目a1の子や孫等の子孫の手段項目a2に入力された手段のうち、実際に過去課題a11を解決する際に採用された手段を「解決手段a12」として扱う。なお、提案システム1及び生成システム2は、例えば、過去課題a11が入力された課題項目a1の子孫の手段項目a2に入力された手段のうち、採用されなかった手段を含む全ての手段を「解決手段a12」として扱ってもよい。
【0014】
(分類モデルの生成システムの構成)
次に、生成システム2の構成について説明する。
図1に示すように、生成システム2は、タグ決定部21、データ作成部22、及びモデル生成部23を備える。
【0015】
タグ決定部21は、それぞれの過去課題a11、及び、階層データD1内において、それぞれの過去課題a11が入力された課題項目a1と親子関係にある項目に入力された情報に基づいて、それぞれの過去課題a11に対応する課題タグc4を決定する。「親子関係にある項目」とは、図2に示すように、過去課題a11が入力された課題項目a1の親項目b1及び子項目b2である。
【0016】
課題タグc4は、例えば、それぞれの過去課題a11の文章と、親項目b1及び子項目b2に入力された文章と、から抽出される単語及び抽出した単語の同義語に基づいて決定されている。図1に示すように、タグ決定部21は、例えば、同義語の検索や課題タグc4の決定にオントロジーD3を用いる。
【0017】
オントロジーD3は、複数のドメインにおいて用いられる概念同士の関係を体系化したものである。同じような意味の課題であっても、ドメインが異なる場合、異なる単語を用いて課題が表現される場合がある。オントロジーD3は、例えば、各ドメインにおいて用いられる単語同士の関係を盛り込んで、単語の上下関係や同義関係等を体系化した概念辞書である。
【0018】
データ作成部22は、複数の課題タグc4が相互の関連性に応じて複数のカテゴリに分類された教師データD4を作成する。具体的には、データ作成部22は、オントロジーD3を用いて、複数の課題タグc4をドメインを横断した統一の概念でまとめることのできる課題タグ群に分ける。データ作成部22は、1つの課題タグ群を1つのカテゴリとする。すなわち、それぞれのカテゴリには、ドメインを横断した統一の概念でまとめることのできる複数の課題タグc4が属している。したがって、「ドメイン」は、例えば、「列車の空調事業」や「原子力事業」等の組織の事業領域であるのに対し、「カテゴリ」は、例えば、「調達系」や「据え付け系」等の複数のドメインにおいて共通して行われる業務である。
【0019】
また、データ作成部22は、例えば、課題タグc4に階層データD1から抽出された過去課題a11及び解決手段a12を紐づけてカテゴリごとにまとめたセットデータD2を作成する。セットデータD2は、後述する提案システム1の検索部13及び出力部14に提供される。
【0020】
モデル生成部23は、データ作成部22が作成した教師データD4を用いて分類モデルD5を生成する。生成された分類モデルD5は、後述する提案システム1の推定部12に提供され、推定部12が新規課題i1が分類されるカテゴリを推定するのに用いられる。
【0021】
分類モデルD5は、テキスト分類モデルである。分類モデルD5は、例えば、1つの新規課題i1が複数のカテゴリに分類されることを許容するマルチクラス分類モデルである。分類モデルD5に用いられる手法は、例えば、ニューラルネットワークである。ニューラルネットワークを用いたテキスト分類モデルとしては、例えば、Facebook, Inc.のオープンソースであるfastText等が挙げられる。
【0022】
ただし、分類モデルD5に用いられる手法は、上記に限定されず、例えば、サポートベクターマシン(Support Vector Machine:SVM)、k近傍法、ロジスティック回帰等であってもよい。また、分類モデルは、1つの新規課題i1を1つのカテゴリのみに分類する排他的分類モデルであってもよい。
【0023】
このように作成された分類モデルD5は、例えば、任意の語句を入力として、入力された語句のそれぞれのカテゴリにおける関連度を出力することができる。
【0024】
(解決手段の提案システムの構成)
次に、提案システム1の構成について説明する。
提案システム1は、入力部11、推定部12、検索部13、及び出力部14を備える。
【0025】
入力部11は、提案システム1への入力を受け付ける。それぞれのドメインにおける使用者は、提案システム1に対して、端末を用いて新規課題i1の入力、検索条件の設定、及び検索指示等を行う。入力部11は、端末から検索指示を受けるとともに、新規課題i1や検索条件等を取得する。
【0026】
推定部12は、生成システム2から提供された分類モデルD5を用いて、複数のカテゴリのうち新規課題i1が分類されるカテゴリを推定する。
【0027】
検索部13は、複数の過去課題a11がカテゴリごとにまとめられたセットデータD2を参照して、推定されたカテゴリ内において、複数の過去課題a11のうち新規課題i1と類似する過去課題a11を検索する。このように、関連性の高い過去課題a11同士が属するカテゴリ内から、新規課題i1に類似する過去課題a11が検索される。このため、新規課題i1に類似する適切な過去課題a11を検出できる。
【0028】
検索部13は、新規課題i1に類似する過去課題a11を検索する際に、文章をベクトル化するベクトル化ツールD6を用いてもよい。ベクトル化ツールD6としては、例えば、Word2Vec、及びDoc2Vec等が挙げられる。ベクトル化ツールD6は、例えば、階層データD1内の各項目に入力された文章を教師データとして学習済みである。
【0029】
検索部13は、ベクトル化ツールD6を用いて、新規課題i1の文章及び推定されたカテゴリに属する各過去課題a11の文章をベクトル化する。検索部13は、例えば、各カテゴリについて、新規課題i1を表すベクトルに最も距離が近いベクトルで表される過去課題a11を、新規課題i1に類似する過去課題a11とする。なお、検索部13は、新規課題i1を表すベクトルとの距離が閾値以下のベクトルで表される過去課題a11を検出し、検出した過去課題a11を新規課題i1に類似する過去課題a11としてもよい。
【0030】
出力部14は、生成システム2から提供されたセットデータD2を参照して、新規課題i1に類似する過去課題a11の解決手段a12を出力する。
【0031】
提案システム1及び生成システム2は、例えば、CPU(Central Processing Unit)及びメモリを有し、それぞれのドメインの端末に接続されたサーバによって実現される。サーバは、1つのコンピュータによって構成されていてもよいし、複数のコンピュータによって構成されていてもよい。なお、提案システム1と生成システム2は、別々のコンピュータによって実現してもよい。また、提案システム及び生成システムを実現するハードウェアは、サーバに限定されない。例えば、提案システム及び生成システムは、クラウドにアップされた新規課題や過去データ等の各種データを用いて処理を行うコンピュータによって実現されてもよい。また、提案システムを実現するハードウェアと生成システムを実現するハードウェアは異なっていてもよい。
【0032】
(分類モデルの生成方法)
図3は、本実施形態に係る分類モデルの生成方法を示すフローチャートである。
図4及び図5は、課題タグを決定する方法を示す図である。
次に、具体例を用いて、本実施形態に係る分類モデルの生成方法について説明する。
先ず、生成システム2のタグ決定部21は、図3図5に示すように、それぞれの過去課題a11、及び、階層データD1内において、それぞれの過去課題a11が入力された課題項目a1と親子関係にある項目b1、b2に入力された情報に基づいて、それぞれの過去課題a11に対応する課題タグc4を決定する(工程S11)。
【0033】
より具体的に、タグ決定部21は、図4に示すように、過去課題a11の文章と、親項目b1に入力された文章と、子項目b2に入力された文章と、を形態素解析し、各文章から助詞及び助動詞を除いた単語(自立語)を抽出する(工程S11a)。以下、抽出された単語を「抽出語c1」という。すなわち、図4の例で説明すれば、過去課題a11の文章は「製品の耐久性」である。親項目b1に入力された文章は「半導体応用製品の調達業務」である。5つの子項目b2に入力された文章は、「適切な設計」、「適切な材料の選定」、「適切な製造」、「適切な検査」、及び「適切な出荷搬送」である。そして、これらの文章中の自立語が抽出語c1である。
【0034】
次に、タグ決定部21は、オントロジーD3を参照して、それぞれの抽出語c1の同義語c2を追加する(工程S11b)。
【0035】
次に、タグ決定部21は、図5に示すように、オントロジーD3を用いて、複数の抽出語c1及び複数の同義語c2の代表語c3を決定する(工程S11c)。
具体的に、先ず、タグ決定部21は、複数の抽出語c1及び複数の同義語c2を、オントロジーD3を用いて、統一の概念でまとめることのできる単語群gに分ける。次に、タグ決定部21は、複数の単語群gからいくつかの単語群gを選出する。選出の方法は特に限定されないが、例えば、課題を表現する観点等から優先度の低い単語群gを除去した上で、含まれる語数が多い上位の単語群gを選出してもよい。
【0036】
次に、タグ決定部21は、選出したそれぞれの単語群gについて、含まれる抽出語c1及び同義語c2を集約した代表語c3を決定する。それぞれの代表語c3は、例えば、各単語群gに含まれる抽出語c1及び同義語c2の上位語であってもよいし、各単語群gに含まれる抽出語c1及び同義語c2のうちのいずれかの単語であってもよい。なお、図5の例では、代表語c3の数は、6つであるが、代表語c3の数は特に限定されない。
【0037】
次に、タグ決定部21は、決定した複数の代表語c3に基づいて、課題タグc4を決定する(工程S11d)。課題タグc4は、全ての代表語c3を組み合わせたものであってもよいし、決定した複数の代表語c3を集約した単語又は単語の組み合わせであってもよい。なお、図では、それぞれの課題タグc4を便宜的に「Y」に数字を組み合わせた文字列で表す。
【0038】
タグ決定部21は、このように過去課題a11だけでなく親子関係にある項目b1、b2に入力された情報に基づいて、課題タグc4を決定する。このため、図4及び図5を例に説明すれば、課題タグc4には、過去課題a11の「製品の耐久性」という文章では表現されていない、「調達」、「設計」、「製造」及び「搬送」等の特徴が含まれている。このように、課題タグc4には、過去課題a11の上位側の階層の情報及び下位側の階層の情報の特徴が含まれている。
【0039】
また、タグ決定部21は、各過去課題a11の文章と、親子関係にある項目b1、b2に入力された文章と、から抽出される抽出語c1及び抽出語c1の同義語c2に基づいて、課題タグc4を決定する。これにより、過去課題a11の文章及び親子関係にある項目b1、b2に入力された文章の表現のみに限定されずに、それぞれの過去課題a11に適切な課題タグc4が付与される。
【0040】
なお、課題タグc4の決定方法は、上記に限定されない。例えば、課題タグc4は、オントロジーD3等を用いてタグ決定部21により機械的に決定されるのではなく、専門家等により人為的に決定されてもよいし、機械的な方法と人為的な方法とを組み合わせた方法で決定されてもよい。
【0041】
図6は、複数の課題タグを複数のカテゴリに分類する方法を示す図である。
図6に示すように、上述した工程S11により、各ドメインの各過去課題a11に課題タグc4が付与される。
【0042】
次に、データ作成部22は、複数の課題タグc4が相互の関連性に応じて複数のカテゴリに分類された教師データD4を作成する(工程S12)。
工程S12において、例えば、データ作成部22は、オントロジーD3を用いて、複数の課題タグc4を、複数のドメインを横断した統一の概念でまとめることができる課題タグ群hに分ける。データ作成部22は、1つの課題タグ群hを1つのカテゴリとする。なお、この際、例えば、一つの課題タグc4が複数のカテゴリに属してもよい。図6に示す例では、「調達系」、「据え付け系」、「製品系」、「メンテ系」、「設計系」、「生産系」、及び「搬送系」等がカテゴリである。
【0043】
なお、教師データD4の作成方法は、上記に限定されない。例えば、課題タグc4は、オントロジーD3等を用いてデータ作成部22により機械的にカテゴリに分類されるのではなく、専門家等により人為的にカテゴリに分類されてもよいし、機械的な方法と人為的な方法とを組み合わせた方法でカテゴリに分類されてもよい。
【0044】
また、データ作成部22は、課題タグc4が過去課題a11及び解決手段a12に紐づけられてカテゴリごとにまとめられたセットデータD2(図10参照)を作成する。データ作成部22は、セットデータD2を検索部13に提供する。
【0045】
次に、モデル生成部23は、教師データD4を用いて分類モデルD5を生成する(工程S13)。モデル生成部23が生成した分類モデルD5は、提案システム1の推定部12に提供される。
【0046】
なお、教師データD4を用いて分類モデルD5を生成する際は、データ作成部22が作成した教師データD4の全てを分類モデルD5の学習に用いてもよいし、データ作成部22が作成した教師データD4の一部のみを分類モデルD5の学習に用いてもよい。
【0047】
(解決手段の提案方法)
図7は、本実施形態に係る解決手段の提案方法を示すフローチャートである。
次に、本実施形態に係る解決手段の提案方法を説明する。
先ず、使用者は、端末を用いて提案システム1に対して新規課題i1の入力、検索条件の設定、及び検索開始の指示等を行う。入力部11は、検索開始の指示を受けるとともに、新規課題i1及び検索条件等を取得する(工程S21)。
【0048】
次に、推定部12は、工程S13において学習済みの分類モデルD5を用いて、複数のカテゴリのうち新規課題i1が分類されるカテゴリを推定する(工程S22)。
【0049】
図8は、新規課題が分類されるカテゴリを推定する方法を示す図である。
推定部12は、例えば、新規課題i1の文章から位置をずらして複数の部分語i2を切り出す。推定部12は、例えば、切り出しの開始位置を1文字ずつずらしながら、3文字からなる部分語i2を順次切り出す。ただし、部分語i2の文字数及びずらす文字数等は上記に限定されない。
【0050】
次に、推定部12は、切り出した複数の部分語i2を分類モデルD5に入力し、分類モデルD5にそれぞれの部分語i2とそれぞれのカテゴリとの関連度i3を出力させる。例えば、分類モデルD5は、それぞれの部分語i2について、それぞれのカテゴリとの関連度i3を成分とする縦ベクトルVを算出する。以下、各部分語i2の縦ベクトルVを横に配列してまとめたものを関連度マトリクスMという。
【0051】
次に、推定部12は、関連度マトリクスMにおいて、それぞれのカテゴリの関連度i3の最大値を算出し、それぞれのカテゴリについて算出した最大値が閾値以上であるか否かを判断する。図8の例では、「調達系」のカテゴリの関連度i3の最大値は0.77である。「据え付け系」のカテゴリの関連度i3の最大値は0.99である。「製品系」のカテゴリの関連度i3の最大値は0.11である。「メンテ系」のカテゴリの関連度i3の最大値は0.73である。
【0052】
図9は、それぞれのカテゴリの関連度の最大値を示すグラフである。
推定部12は、図9に示すように、関連度i3の最大値が閾値以上となるカテゴリを、新規課題i1が分類されるカテゴリと推定する。図9の例では、「据え付け系」、「メンテ系」、及び「調達系」の関連度i3の最大値が閾値を超えている。したがって、推定部12は、「据え付け系」、「メンテ系」、及び「調達系」が新規課題i1が分類されるカテゴリと推定する。なお、閾値は、例えば、工程S21において使用者が任意の値に設定できるようにしてもよい。
【0053】
このように、新規課題i1の文章から位置をずらして複数の部分語i2が切り出される。そして、分類モデルD5は、切り出された複数の部分語i2を入力として、それぞれの部分語i2とそれぞれのカテゴリとの関連度i3を出力する。そして、関連度i3に基づき、新規課題i1が分類されるカテゴリが推定される。少なくともいずれか1つの部分語i2は、文章中において近い位置に配置された単語群の一部を含んでいる。その結果、新規課題i1の文章の文脈的に関連のあるカテゴリを推定できる。なお、新規課題i1が分類されるカテゴリの推定方法は上記に限定されない。
【0054】
図10は、類似する過去課題の検索方法を示す図である。
次に、検索部13は、図10に示すように、セットデータD2を参照して、推定された各カテゴリ内において、複数の過去課題a11のうち新規課題i1と類似する過去課題a11を検索する(工程S23)。
【0055】
工程S23において、検索部13は、例えば、ベクトル化ツールD6を用いて、新規課題i1の文章及び推定された各カテゴリ内の過去課題a11の文章をベクトル化する。
【0056】
次に、検索部13は、例えば、それぞれのカテゴリ内において、新規課題i1を表すベクトルに最も距離が近いベクトルで表される過去課題a11を検出し、検出した過去課題a11を、新規課題i1に類似する過去課題a11とする。
【0057】
図10に示す例では、「据え付け系」のカテゴリについて「Y22」の課題タグc4が付された過去課題a11が、新規課題i1に類似する過去課題a11として検出されている。「メンテ系」のカテゴリについて「Y21」の課題タグc4が付された過去課題a11が、新規課題i1に類似する過去課題a11として検出されている。「調達系」のカテゴリについて「Y33」の課題タグc4が付された過去課題a11が、新規課題i1に類似する過去課題a11として検出されている。例えば、検索部13は、カテゴリ内において複数の過去課題a11のうち新規課題i1と類似する過去課題a11を課題タグc4に基づいて検索してもよい。この場合も、ベクトル化ツールD6を用いて、新規課題i1に対応する課題タグc4及び推定された各カテゴリ内の過去課題a11に対応する課題タグc4をそれぞれベクトル化すればよい。
【0058】
このように、関連性の高い過去課題a11同士が属するカテゴリ内から、新規課題i1に類似する過去課題a11が検索される。このため、新規課題i1に類似する適切な過去課題a11を検出できる。なお、前述したように、課題タグc4には、過去課題a11の上位側の階層の情報及び下位側の階層の情報の特徴が含まれている。従って、各過去課題a11は、課題タグc4を用いて適切なカテゴリに分類されている。なお、新規課題i1に類似する過去課題a11を検索する方法は、上記に限定されない。
【0059】
図11は、出力を例示する図である。
次に、出力部14は、セットデータD2を参照して、推定した各カテゴリについて、類似する過去課題a11の解決手段a12を出力する(工程S24)。
出力部14は、例えば、推定されるカテゴリ、それぞれのカテゴリにおいて類似する過去課題a11とその解決手段a12等を出力する。類似する過去課題a11は、1つのカテゴリについて1つでもよいし、複数であってもよい。使用者は、出力された解決手段a12を参考にして、新規課題i1の解決手段を検討できる。
【0060】
なお、分類モデルD5の生成は、提案システム1が初めて使用される前に、少なくとも1度行われていればよい。例えば、分類モデルD5の生成は1度のみ行われ、提案システム1は新規課題i1が分類されるカテゴリを推定する度に、同じ分類モデルD5を使用してもよい。また、例えば、階層データD1が新たに提供されたタイミングや既存の階層データD1の内容が更新されたタイミングで、分類モデルD5の再生成が行われてもよい。
【0061】
次に、本実施形態の効果について説明する。
本実施形態においては、新規課題i1が分類されると推定されたカテゴリ内で、新規課題i1に類似する過去課題a11が検索される。このため、関連性の高い過去課題a11同士が属するカテゴリ内から、新規課題i1に類似する過去課題a11が検索される。その結果、新規課題i1に類似する適切な過去課題a11を検出できる。
【0062】
また、本実施形態において、それぞれの過去課題a11は、課題項目a1及び手段項目a2が階層構造をなすように配置された少なくとも1つの階層データD1内において、いずれかの課題項目a1に入力されている。そして、課題タグc4は、それぞれの過去課題a11、及び、階層データD1内において、それぞれの過去課題a11が入力された課題項目a1と親子関係にある項目b1、b2に入力された情報に基づいて決定されている。したがって、課題タグc4には、過去課題a11の上位側の階層の情報及び下位側の階層の情報の特徴が含まれている。このため、各過去課題a11を課題タグc4を用いて適切なカテゴリに分類できる。
【0063】
また、本実施形態において、それぞれの課題タグc4は、それぞれの過去課題a11の文章と、親子関係にある項目b1、b2に入力された文章と、から抽出された抽出語c1及び抽出語c1の同義語c2に基づいて決定されている。これにより、過去課題a11の文章の表現のみに限定されずに、それぞれの過去課題a11に適切な課題タグc4が付与される。
【0064】
また、本実施形態において、新規課題i1の文章から位置をずらして複数の部分語i2が切り出される。そして、分類モデルD5は、切り出された複数の部分語i2を入力として、それぞれの部分語i2とそれぞれのカテゴリとの関連度i3を出力する。そして、出力された関連度i3に基づき、複数のカテゴリのうち新規課題i1が分類されるカテゴリが推定される。少なくともいずれかの部分語i2は、新規課題i1の文章中において近い位置に配置された単語群の一部を含んでいる。その結果、新規課題i1の文章の文脈的に関連のあるカテゴリを推定できる。
【0065】
また、本実施形態においては、それぞれのカテゴリには、複数のドメインを横断した統一の概念でまとめることのできる複数の課題タグc4が属している。その結果、ドメインを問わず、新規課題i1に類似する適切な過去課題a11を検索することができる。
【0066】
以上説明した実施形態によれば、新規課題i1に類似する適切な過去課題a11を検出できる解決手段a12の提案方法及び提案システムと、このような解決手段a12の提案方法に用いられる分類モデルD5の生成方法と、を実現することができる。
【0067】
<第2の実施形態>
次に、第2の実施形態について説明する。
図12(a)は、本実施形態に係る解決手段の提案システムにおいて新規課題が分類されるカテゴリの推定方法を示す図であり、図12(b)は、本実施形態に係る解決手段の提案システムにおいて複数の過去課題のうち新規課題に類似する過去課題の抽出方法を示す図である。
図13は、本実施形態に係る解決手段の提案システムの検索条件の設定画面を示す図である。
図14は、本実施形態に係る解決手段の提案システムの出力を示す図である。
なお、以下の説明においては、原則として、第1の実施形態との相違点のみを説明する。以下に説明する事項以外は、第1の実施形態と同様である。
【0068】
推定部12は、図12(a)に示すように、第1の実施形態と同様に、新規課題i1と複数のカテゴリとの関連度を算出可能である。そして、推定部12は、複数のカテゴリのうち関連度が第1閾値TH1以上のカテゴリを、新規課題i1が分類されるカテゴリとして推定する。
【0069】
また、検索部13は、図12(b)に示すように、新規課題i1と類似する過去課題a11との類似度を算出可能である。そして、検索部13は、複数の過去課題a11のうち推定されたカテゴリに分類され、新規課題i1との類似度が第2閾値TH2以上の過去課題a11を類似する過去課題a11として抽出する。類似度は、新規課題i1と過去課題a11との類似の程度を表すものであれば特に限定されないが、例えば、コサイン類似度、又は、意味空間における新規課題i1と過去課題a11との距離等が挙げられる。
【0070】
入力部11は、図13に示すように、新規課題i1の入力の際に、使用者による第1閾値TH1及び第2閾値TH2の設定も受け付ける。例えば、検索前に、使用者が操作するコンピュータに、図13に示すような画面が表示される。使用者は、コンピュータのキーボードやマウス等の操作部を介して、新規課題i1を入力するとともに、第1閾値TH1及び第2閾値TH2を設定し、検索ボタン210を押す。これにより、設定した条件での検索が開始される。
【0071】
出力部14は、図14に示すように、類似する過去課題a11の解決手段a12を出力する際に、推定されたカテゴリと新規課題i1との関連度k1も出力する。また、出力部14は、複数のカテゴリのうち、新規課題i1との関連度が第1閾値TH1未満であって関連度が上位の複数のカテゴリ及びその関連度k2を参考情報として出力する。これにより、使用者は、新規課題i1が分類されると推定されなかったカテゴリの関連度k2を確認し、第1閾値TH1が適切か否かを判断できる。なお、参考情報として関連度が第1閾値未満のカテゴリのうち、関連度が最大であるカテゴリ及びその関連度のみを出力してもよい。
【0072】
出力部14は、類似する過去課題a11の解決手段a12を出力する際に、新規課題i1と類似する過去課題a11との類似度k3も出力する。また、出力部14は、複数の過去課題a11のうち、新規課題i1との類似度k3が第2閾値TH2未満であって類似度が上位の過去課題a11及びその類似度k4を参考情報として出力する。これにより、使用者は、抽出されなかった過去課題a11の類似度k4を確認し、第2閾値TH2が適切か否かを判断できる。なお、参考情報として類似度が第2閾値未満の過去課題のうち、類似度が最大である過去課題及びその関連度のみを出力してもよい。
【0073】
入力部11は、類似する過去課題a11の解決手段a12を出力後も、第1閾値TH1及び第2閾値TH2の変更を受け付け可能に構成している。例えば、使用者が操作するコンピュータに図14に示すような画面が表示された場合に、使用者は、コンピュータのキーボードやマウス等の操作部を介して、第1閾値TH1及び第2閾値TH2を再設定し、再検索ボタン220を押す。これにより、設定した条件での再検索が開始される。
【0074】
以上説明したように、出力部14は、推定されたカテゴリと新規課題i1との関連度k1を出力する。そのため、使用者は、推定されたカテゴリと新規課題i1との関連度k1を把握できる。
【0075】
また、出力部14は、複数のカテゴリのうち、新規課題i1との関連度が第1閾値TH1未満のカテゴリのうち関連度が最大であるカテゴリの関連度k2を出力する。また、入力部11は、第1閾値TH1の変更を受け付け可能に構成している。そのため、使用者は、第1閾値TH1が適切な値か否かを判断し、必要に応じて、第1閾値TH1の値を変更し、新規課題i1が分類されると推定されるカテゴリの数を増減できる。
【0076】
また、検索部13は、抽出された類似する過去課題a11と新規課題i1との類似度k3を出力する。そのため、使用者は、抽出された過去課題a11と新規課題i1との類似度k3を把握できる。
【0077】
また、出力部14は、複数の過去課題のうち、新規課題i1との類似度が第2閾値TH2未満の過去課題a11のうち類似度が最大である過去課題a11の類似度k4を出力する。また、入力部11は、第2閾値TH2の変更を受け付け可能である。そのため、使用者は、第2閾値TH2が適切な値か否かを判断し、必要に応じて、第2閾値TH2の値を変更し、抽出される類似する過去課題a11の数を増減できる。
【0078】
<第3の実施形態>
次に、第3の実施形態について説明する。
図15は、本実施形態に係る解決手段の提案システムにおける課題タグの決定方法を示す図である。
第1の実施形態では、過去課題a11と、階層データD1のうち過去課題a11と親子関係にある項目の項目に入力された情報と、に基づいて過去課題a11の課題タグc4を決定した。これに対して、第3の実施形態では、過去課題a11と、階層データD1のうち過去課題a11が属するドメイン300内において過去課題a11と関連する情報と、に基づいて過去課題a11の課題タグc4を決定する。
【0079】
第1の実施形態と同様に、複数の階層データD1は、複数のドメイン300から提供される。そのため、複数の階層データD1において、各過去課題a11は、いずれかのドメイン300に属する。図15に示すように、あるドメイン300に属する「入荷品の品質を確認する」という過去課題a11の課題タグc4を決定する際は、先ず、タグ決定部21は、複数の階層データD1のうち、同じドメイン300内において過去課題a11と関連する情報を抽出する。抽出される情報は、特に限定されないが、例えば、課題項目a1に入力された文章、手段項目a2に入力された文章、又は課題項目a1及び手段項目a2に入力された文章の両方等が挙げられる。図15では、例えば、「生産プロセスやレシピ変更でばらつきを抑制する」という課題項目a1に入力された文章及び「冗長な検査や信頼性に抜き取り検査を入れる」という課題項目a1に入力された文章が、関連する情報として抽出されている。
【0080】
過去課題a11と関連する情報を抽出する方法は特に限定されないが、例えば、word2vec等の文章のベクトル化ツールD6等を用いた機械的な方法、専門家等が関連する情報を抽出する等の人為的な方法、又は機械的な方法及び人為的な方法を組み合わせた方法等が挙げられる。ベクトル化ツールD6を用いる場合は、複数の階層データD1のうち同じドメイン300に属し、かつ、意味空間での距離が近い情報が抽出される。
【0081】
以降の手順は、第1の実施形態と同様であり、「入荷品の品質を確認する」という文章、「生産プロセスやレシピ変更でばらつきを抑制する」という文章、及び「冗長な検査や信頼性に抜き取り検査を入れる」という文章から単語を抽出し、抽出した単語の同義語を追加し、最終的な課題タグc4を決定する。
【0082】
以上説明したように、階層データD1において過去課題a11の課題タグc4を決定する際に用いる情報は、過去課題a11が入力された課題項目a1と親子関係にある項目に入力された情報に特に限定されず、階層データD1において過去課題a11が属するドメインと同じドメインに属し、かつ、過去課題a11と関連する情報であれば特に限定されない。
【0083】
<第4の実施形態>
次に、第4の実施形態について説明する。
図16は、本実施形態に係る過去データを示す図である。
第1の実施形態、第2の実施形態、及び第3の実施形態において、過去課題a11が入力されており、課題タグc4の決定に用いられる過去データは、階層データD1である。これに対して、本実施形態では、過去課題a11が入力されており、課題タグc4の決定に用いられる過去データは、表データD41である。
【0084】
表データD41は、複数の過去課題a11に複数の解決手段a12が紐づけられた表形式のデータである。この場合は、過去課題a11の課題タグc4は、第3の実施形態と同様に、過去課題a11と、表データD41のうち過去課題a11と同じドメイン300に属し、かつ、過去課題a11と関連する情報と、に基づいて決定される。例えば、あるドメイン300に属する「入荷品の品質を確認する」という過去課題a11の課題タグc4を決定する際は、第3の実施形態と同様に、「生産プロセスやレシピ変更でばらつきを抑制する」という過去課題a11及び「冗長な検査や信頼性に抜き取り検査を入れる」という過去課題a11が、関連する情報として抽出される。ただし、第3の実施形態と同様に、解決手段a12が関連する情報として抽出されてもよい。
【0085】
以上、説明したように、過去課題a11が入力されており、課題タグc4の決定に用いられる過去データは、過去課題a11に解決手段a12が紐づけられたものであれば階層データD1に限定されず、表データD41等の他の形式のデータであってもよい。
【0086】
以上、本発明の実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これらの新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明及びその等価物の範囲に含まれる。
【符号の説明】
【0087】
1:提案システム
2:生成システム
11:入力部
12:推定部
13:検索部
14:出力部
21:タグ決定部
22:データ作成部
23:モデル生成部
D1:階層データ(過去データ)
D2:セットデータ
D3:オントロジー
D4:教師データ
D5:分類モデル
D6:ベクトル化ツール
D41:表データ
M:関連度マトリクス
V:縦ベクトル
a0:対象項目
a1:課題項目
a11:過去課題
a2:手段項目
a12:解決手段
b1:親項目
b2:子項目
c1:抽出語
c2:同義語
c3:代表語
c4:課題タグ
g:単語群
h:課題タグ群
i1:新規課題
i2:部分語
i3、k1、k2:関連度
k3、k4:類似度
TH1:第1閾値
TH2:第2閾値
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16