IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

<>
  • 特許-対話システム 図1
  • 特許-対話システム 図2
  • 特許-対話システム 図3
  • 特許-対話システム 図4
  • 特許-対話システム 図5
  • 特許-対話システム 図6
  • 特許-対話システム 図7
  • 特許-対話システム 図8
  • 特許-対話システム 図9
  • 特許-対話システム 図10
  • 特許-対話システム 図11
  • 特許-対話システム 図12
  • 特許-対話システム 図13
  • 特許-対話システム 図14
  • 特許-対話システム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】対話システム
(51)【国際特許分類】
   G06F 40/56 20200101AFI20231121BHJP
   G06F 40/44 20200101ALI20231121BHJP
   G06F 16/90 20190101ALI20231121BHJP
【FI】
G06F40/56
G06F40/44
G06F16/90 100
【請求項の数】 6
(21)【出願番号】P 2020001956
(22)【出願日】2020-01-09
(65)【公開番号】P2021111075
(43)【公開日】2021-08-02
【審査請求日】2022-05-24
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001689
【氏名又は名称】青稜弁理士法人
(72)【発明者】
【氏名】高平 寛之
(72)【発明者】
【氏名】但馬 慶行
(72)【発明者】
【氏名】望月 義則
【審査官】長 由紀子
(56)【参考文献】
【文献】国際公開第2018/097091(WO,A1)
【文献】特開2011-100190(JP,A)
【文献】特開2013-254451(JP,A)
【文献】特開2019-125145(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-58
G06F 16/00-958
(57)【特許請求の範囲】
【請求項1】
現象に関する第1の文章を受け付ける現象文章受付部と,
前記第1の文章に対する対処に関する分類を出力する対処推薦部と,
前記対処推薦部が出力した対処に関する分類に基づいた表示を行う対処表示部と,
を少なくとも備え,
前記対処に関する分類はシステム中で複数が定義されており,
前記対処推薦部が,
文章生成モデルを用いて,前記第1の文章と複数の前記対処に関する分類それぞれとの組み合わせに基づいて,複数の文章を生成することにより,前記第1の文章から,該第1の文章とは異なる複数の現象に関する第2の文章を生成し,
機械学習を用いた推薦モデルを用いて,前記第2の文章から,前記第2の文章に対する対処に関する分類を推定し,
前記対処表示部が,
前記第2の文章および前記第2の文章に対する対処に関する分類の組に基づいた表示を行う,
対話システム。
【請求項2】
前記対処推薦部が,
尤度評価モデルを用いて,少なくとも一つの前記第2の文章の前記第1の文章に対する尤度を算出し,
前記推薦モデルが,
前記第2の文章に対する対処に関する分類の確率を推定し,
前記対処推薦部が,
前記第2の文章に対する対処に関する分類の確率および前記尤度に基づいて、前記対処表示部が表示する前記第2の文章を選別し,
前記対処表示部が,
選別された前記第2の文章および前記第2の文章に対する対処に関する分類の組に基づいた表示を行う,
請求項1記載の対話システム。
【請求項3】
前記対処推薦部が,
前記推薦モデルを用いて,前記第1の文章から,前記第1の文章に対する対処に関する分類を推定し,
前記第1の文章に対する対処に関する分類の推定結果に基づいて,前記第2の文章および前記第2の文章に対する対処に関する分類の組に基づいた表示を行うか否かを決定する,
請求項1記載の対話システム。
【請求項4】
前記推薦モデルが,
前記第1の文章に対する対処に関する分類の確率を推定し,前記第2の文章に対する対処に関する分類の確率を推定し,
前記対処表示部が,
前記第2の文章に対する対処に関する分類の確率の表示を行うとともに,前記第2の文章を表示する,
請求項3記載の対話システム。
【請求項5】
前記現象文章受付部が,
前記第1の文章とともに閾値を受け付け,
前記対処推薦部が,
前記第2の文章に対する対処に関する分類の確率が前記閾値の条件を満たす前記第2の文章を選別し,
前記対処表示部が,
前記閾値の条件を満たす前記第2の文章に関する表示を行う,
請求項4記載の対話システム。
【請求項6】
前記対処表示部が,
前記第1の文章に対する対処に関する分類の確率と前記第2の文章に対する対処に関する分類の確率の,比較可能な表示を行う,
請求項5記載の対話システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は,データに基づく機械学習装置に関し,とくに,与えられた文章をもとに,別の文章を生成し,それを活用してユーザに追加情報の提供を促す対話システムおよび文章生成装置の構成方法に関する。
【背景技術】
【0002】
近年,IoTによる産業のデジタル化を背景に,工場・物流・発電施設などでは,機器,設備,車両など多種多様なアセットが運用されている。これらのアセットはときに電気的,機械的などの理由で故障が発生することがある。アセットの故障発生時には,部品の交換や修繕などを施すことで,運用に大きな支障が出ないようにすることが重要である。しかしながら,アセットの複雑化や熟練した修理員の不足などから,適切な対処が成されない場合がある。そこで,アセットに関する故障時の情報とアセットに施した対処の情報との組を収集した修理履歴をもとに適切な対処を推薦することで熟練した修理員を補い,安定的にアセット運用を可能とするシステムなどが実現されつつある。
【0003】
上記のようなシステム・サービスにおいて,適切な対処を推薦するための機械学習を用いたモデル(「推薦モデル」と呼ぶ)は,修理履歴に含まれるアセットに関する故障時の情報とアセットに施した対処の関係性を学習する教師あり学習と呼ばれる枠組みに基づいて構築される。アセットに関する故障時の情報には,「異音がする」や「オイルリーク」などの現象に関する文章が広く用いられている。また,アセットに施した対処の情報には,部品番号や修理種別など,対処に関する分類が広く用いられている。この対処に関する分類は,予め定められた特定個数の分類群のうちの1つの分類を示す。そのため,推薦モデルは,過去の現象に関する文章とその対処に関する分類との関係性を学習し,現象に関する文章から対処に関する分類を推薦できることが望ましい。
【0004】
しかしながら,修理員はアセットに対する理解度の低さや確認漏れなどから,対処に関する分類を特定するための情報が不足した曖昧な現象に関する文章をシステムに入力する場合がある。この場合,システムは,入力された現象に関する文章に当てはまりそうな複数の対処に関する分類を全て表示したり,その中の対処に関する分類を1つ表示したりするため,修理員は実施すべき適切な対処に関する分類を特定できなくなってしまう。
【0005】
これに対し,特許文献1では,ユーザに追加情報の提供を促す技術として,過去の現象に関する文章に対して情報量が多い選択肢とFAQ(Frequently Asked Questions)情報を事前に対応付けておき、検索入力文とマッチした現象に関する文章に対応付けてある選択肢をユーザに選ばせ、その選択肢を検索入力文として再入力する技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2003-228575号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら,特許文献1記載の技術では,修理員に追加情報の提供を促すための情報量の多い選択肢を事前に人手で作成しなければならない。そのため,頻度の低い文体の文章や筆者特有の表現で書かれた文章など,品質の低い文章が修理員に提示されてしまうことがある。また,修理員から入力されうる全ての現象に関する文章に対して提示する文章を作るには,多大な人的コストが掛かってしまう。
【0008】
本発明は,上記を鑑みてなされたものであって,与えられた文章をもとに,別の文章を自動生成し,ユーザに追加情報の提供を促すことを目的とする。
【課題を解決するための手段】
【0009】
本発明の好ましい一側面は,現象に関する第1の文章を受け付ける現象文章受付部と,第1の文章に対する対処に関する分類を出力する対処推薦部と,対処推薦部が出力した対処に関する分類に基づいた表示を行う対処表示部と,を少なくとも備える対話システムである。このシステムは,対処推薦部が,文章生成モデルを用いて,第1の文章から,該第1の文章とは異なる複数の第2の文章を生成し,推薦モデルを用いて,第1の文章から,第1の文章に対する対処に関する分類を推定し,また,第2の文章から,第2の文章に対する対処に関する分類を推定する。また,対処表示部が,第1の文章に対する対処に関する分類および第2の文章に対する対処に関する分類に基づいた表示を行う。
【0010】
本発明の好ましい他の一側面は,単語の組み合わせを含む情報を入力として所定の生成文章を出力する文章生成モデルを備える,文章生成装置の構成方法である。この方法は,現象に関する現象文章の集合を含む修理履歴を用い,文章生成モデルの学習を,修理履歴の現象文章に近い文章が生成されることを良しとする第1の指標と,入力された単語の組み合わせを含むことを良しとする第2の指標と,の2つの指標を基準として実行する。
【発明の効果】
【0011】
与えられた文章をもとに,別の文章を自動生成し,ユーザに追加情報の提供を促すことができる。
【図面の簡単な説明】
【0012】
図1】本実施形態における文章生成装置の構成のブロック図。
図2】本実施形態におけるハードウェア構成のブロック図。
図3】本実施形態における修理履歴を示す表図。
図4】本実施形態における対処分類情報を示す表図。
図5】本実施形態における訓練データ集合を示す表図。
図6】本実施形態における推薦受付情報を示す表図。
図7】本実施形態における推薦結果を示す表図。
図8】本実施形態における提示現象文章を示す表図。
図9】本実施形態における学習フェーズの全体処理フロー図。
図10】本実施形態における文章生成モデルの学習フロー図。
図11】本実施形態における文章生成モデル学習時のデータフロー図。
図12】本実施形態における推薦フェーズの全体処理フロー図。
図13】本実施形態における修理履歴入力画面イメージ図。
図14】本実施形態における現象受付画面イメージ図。
図15】本実施形態における結果表示画面イメージ図。
【発明を実施するための形態】
【0013】
実施の形態について、図面を用いて詳細に説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
【0014】
以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、重複する説明は省略することがある。
【0015】
同一あるいは同様な機能を有する要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、複数の要素を区別する必要がない場合には、添字を省略して説明する場合がある。
【0016】
本明細書等における「第1」、「第2」、「第3」などの表記は、構成要素を識別するために付するものであり、必ずしも、数、順序、もしくはその内容を限定するものではない。また、構成要素の識別のための番号は文脈毎に用いられ、一つの文脈で用いた番号が、他の文脈で必ずしも同一の構成を示すとは限らない。また、ある番号で識別された構成要素が、他の番号で識別された構成要素の機能を兼ねることを妨げるものではない。
【0017】
図面等において示す各構成の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面等に開示された位置、大きさ、形状、範囲などに限定されない。
【0018】
本明細書で引用した刊行物、特許および特許出願は、そのまま本明細書の説明の一部を構成する。
【0019】
以下、適宜図面を参照しながら本発明を実施するための代表的な形態を説明する。本実施形態では,前記でも挙げたアセットが不調,故障となったときに,修理履歴に基づいて適切な対処を推薦するシステムで用いる文章生成装置を詳細に説明する。
【0020】
<1.概略>
はじめに,図1を参照して,修理履歴の収集からモデルの学習を行うまでの流れ(「学習フェーズ」と呼ぶ)と,現象に関する文章から対処に関する分類を推薦するまでの流れ(「推薦フェーズ」と呼ぶ)に分けてシステムの使い方の概略を説明する。
<1-1.学習フェーズ>
図1において、まず,学習フェーズにおいて,修理員15は,アセット13の現象に関する文章(修理員15が入力した現象に関する文章を以下「現象文章」ということがある)とアセット13の現象を直すために実施した対処に関する分類(対処の分類を以下「対処分類」ということがある)を,修理員端末12を介して文章生成装置10に送る。文章生成装置10は,修理履歴受付部1021で修理員15から送られた情報を受け付ける。文章生成装置10は,送られてきた現象文章と対処分類の組を収集し,修理履歴管理部1011で修理履歴として管理する。
【0021】
次に,修理履歴のデータが任意の量だけ蓄積されたら、管理者14は任意のタイミングで,管理者端末11を介して,モデルの構築命令を文章生成装置10に送る。そして,文章生成装置10は,修理履歴管理部1011の修理履歴に基づいて,現象文章から各対処分類の確率を出力する推薦モデル1123を学習する。また,現象文章から現象に関する別の文章を生成する文章生成モデル1122を学習する。文章生成モデル1122が生成した当該文章を以下「新しい現象文章」あるいは「生成文章」ということがある。また,ある文章の入力文に対する尤もらしさを出力する尤度評価モデル1124を学習する。推薦モデル1123は推薦モデル学習部1023で学習され、文章生成モデル1122は文章生成モデル学習部1022で学習され、尤度評価モデル1124は尤度評価モデル学習部1024で学習される。学習された推薦モデル1123、文章生成モデル1122、尤度評価モデル1124は、モデル管理部1012で管理される。
【0022】
<1-2.推薦フェーズ>
次に,推薦フェーズにおいて,修理員15は,アセット13の現象に関する文章(現象文章)と対処分類の確率の閾値(以下単に「閾値」ということがある)を,修理員端末12を介して文章生成装置10に送る。文章生成装置10の現象文章受付部1031は、修理員15から送られた情報を受け付ける。ここで,閾値は,例えば修理員15が,対処分類の確率が閾値を超えた分類を実施するという方針で、値等を設定して入力する。
【0023】
次に,文章生成装置10の対処推薦部1032は,送られてきた現象文章と閾値から,学習フェーズで学習した推薦モデル1123を用いて,送られてきた現象文章に対する対処分類と対処分類の確率の組を生成する。また,送られてきた現象文章と閾値から,学習フェーズで学習した推薦モデル1123と文章生成モデル1122と尤度評価モデル1124を用いて,対処分類の確率が閾値より大きく修理履歴の現象文章に対する尤もらしさが大きい上位1もしくは複数件の生成文章と対処分類の確率の組を生成する。そして対処表示部1033は,生成文章に対する対処分類と推薦確率の組を対処分類の確率で並び替えた結果と,対処分類の確率が閾値より大きく修理履歴の現象文章に対する尤もらしさが大きい上位1もしくは複数件の生成文章と対処分類の確率の組を対処分類別に並び替えた結果を,修理員端末12を介して,修理員15に表示する。なお,表示を行う対処表示部1033は,そのものが画像モニタ等の物理的な表示機能を備える必要はない。対処表示部1033は,修理員端末12にデータを送信し、端末の液晶画面などにブラウザ等を利用して画像を表示させることにより表示を行うものであってもよい。
【0024】
<1-3.文章生成装置の構成>
次に,文章生成装置10の処理の概略を説明する。
学習フェーズにおいて,文章生成装置10は,現象文章から生成文章を生成する文章生成モデル1122を構築する。その過程で,送られてきた現象文章に関連した生成文章を生成する文章生成モデル1122を学習させるために,深層学習(Deep Learning)の一種であるGAN(Generative Adversarial Networks)の枠組みで学習させる。その際,一般的なGANでは修理履歴の現象文章に近い文章を生成するように学習させるのに対し本実施例では,修理履歴の現象文章に近く,かつ送られてきた現象文章の下で生起する確率の高い文章を生成するように学習させる。その結果,送られてきた現象文章と近いが異なる生成文章が生成される。これにより,修理員15が入力した現象文章に関連した別の文章が生成されやすくなる。結果として,修理方法に対して網羅的な文章の集合を得ることができる。
【0025】
また,推薦フェーズにおいて,文章生成装置10は,送られてきた現象文章と文章生成モデル1122を用いて,送られてきた現象文章とは異なる生成文章を複数個生成する。その後,文章生成装置10は,生成した複数個の生成文章のなかで,対処分類の確率の閾値より大きく,修理履歴の現象文章に対する尤もらしさが大きい上位1もしくは複数件の生成文章と対処分類の確率の組を生成する。これにより,対処分類の確率の閾値を超え,かつ品質が担保された文章が提示される。ここで,品質が担保されるとは,修理履歴の現象文章と大きく異なる文章が排除されているということである。
【0026】
<2.システム構成>
<2-1.機能ブロック>
図1を用いて本実施形態のシステム構成を説明する。本実施形態のシステムは,文章生成装置10と,管理者14が操作する管理者端末11と,修理員15が操作する修理員端末12と,修理員15が操作するアセット13とを備える。これらの構成要素は,有線あるいは無線によるネットワーク16で相互に接続させる。ネットワーク16自体はLAN(Local Area Network)やWAN(Wide Area Network)などで構成される。なお,上記構成要素は一例であって,要素数は増減してもよい。例えば,分散処理のため文章生成装置10が複数に分かれていてもかまわない。
【0027】
文章生成装置10の詳細について説明する。文章生成装置10は,管理部101と学習部102と推薦部103を備える。管理部101は,修理履歴管理部1011とモデル管理部1012を備える。モデル管理部1012は,文章生成モデル1122と推薦モデル1123と尤度評価モデル1124を管理する。学習部102は,修理履歴受付部1021と文章生成モデル学習部1022と推薦モデル学習部1023と尤度評価モデル学習部1024を備える。推薦部103は,現象文章受付部1031と対処推薦部1032と対処表示部1033を備える。なお,学習部102は以下の推薦フェーズでは省略可能である。
【0028】
<2-2.機能とハードウェア>
次に,図1図2を参照して機能とハードウェアの対応を説明する。
図1は、文章生成装置10が備える機能ブロックを示している。
図2は、文章生成装置10のハードウェア構成を示している。当該ハードウェアは例えばサーバのようなコンピュータで構成される。
図1に示す文章生成装置10が備える管理部101と学習部102と推薦部103は,図2に示すCPU(Central Processing Unit)1H101が、ROM(Read Only Memory)1H102もしくは外部記憶装置1H104に格納されたプログラムをRAM(Random Access Memory)1H103に読み込み、通信I/F(Interface)1H105、マウスやキーボード等に代表される外部入力装置1H106、ディスプレイなどに代表される外部出力装置1H107を制御することで、各種機能が実現される。
【0029】
本実施例では計算や制御等の機能は、記憶装置に格納されたプログラムがプロセッサによって実行されることで、定められた処理を他のハードウェアと協働して実現される。計算機などが実行するプログラム、その機能、あるいはその機能を実現する手段を、「機能」、「手段」、「部」、「ユニット」、「モジュール」、「モデル」等と呼ぶ場合がある。
【0030】
文章生成装置10の構成は、単体のコンピュータで構成してもよいし、あるいは任意の部分が、ネットワークで接続された他のコンピュータで構成されてもよい。発明の思想としては等価であり、変わるところがない。また、本実施例中、ソフトウエアで構成した機能と同等の機能は、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)などのハードウェアでも実現できる。
【0031】
<2-3.データ構造>
図3を用いて,文章生成装置10の管理部101の修理履歴管理部1011が管理する修理履歴1D1を説明する。修理履歴1D1は,修理履歴受付部1021がアセット13の現象に関する文章(現象文章)と対処に関する分類(対処分類)を,修理員端末12を介して収集し,それらを結合したアセットの修理単位のデータである。
【0032】
修理履歴1D1は,修理単位を特定する修理ID1D11と,修理を実施した日時1D12と,現象に関する文章を示す現象文章1D13と,対処分類ID1D14を備える。対処分類IDは後述するが,実施した対処に関する分類が紐づけられている。なお,本実施形態では修理履歴1D1は前記のような項目を備えたが,アセットに関するその他のデータがあってもよいし,前記項目の一部項目のみを備えたものであってもよい。
【0033】
一般に、推薦モデル学習部1023は、現象文章1D13を質問とし、対処分類ID1D14を回答とした組を教師データとして、推薦モデル1123の教師有り学習を行う。
【0034】
図4を用いて,文章生成装置10の管理部101の修理履歴管理部1011が管理する対処分類情報1D2を説明する。対処分類情報1D2は,アセット13に想定される全ての対処に関する分類をあらかじめ管理者14が管理者端末11を通じて修理履歴管理部1011に保存しているアセットの修理単位のデータであって,対処に関する分類を特定する対処分類ID1D21と,対処に関する分類を示す対処分類1D22を備える。
【0035】
なお,本実施形態では対処分類情報1D2は前記のような項目を備えたが,対処に関する修理箇所や交換する部品番号,修理手順書等に紐づけられた修理種別,修理手順書等のファイルやURL(Uniform Resource Locator)など修理作業に関する情報を備えていても構わない。また, 対処分類情報1D2は4種類の対処に関する分類のみを扱っているが,それ以上でも以下であってもよい。
【0036】
図5を用いて,文章生成装置10の学習部102の文章生成モデル学習部1022で生成する訓練データ集合1D3を説明する。訓練データ集合1D3は,修理履歴管理部1011が管理する修理履歴1D1から生成される,文章生成モデルを学習させるための訓練データ集合である。訓練データ集合1D3は,現象に関する文章を示す現象文章1D31と,対処分類ID1D32と,単語の組合せ1D33を備える。
【0037】
単語の組合せ1D33は図10図11で後述するが,現象文章1D31の現象に関する文章ごとに,少なくとも1つ以上の単語を含む単語の組合せを格納する。現象文章1D31は、修理履歴1D1(図3)の現象文章1D13を引き継ぎ、対処分類ID1D32は、修理履歴1D1の対処分類ID1D14を引き継ぐ。
【0038】
図6を用いて,文章生成装置10の推薦部103の現象文章受付部1031が受け付ける推薦受付情報2D1を説明する。推薦受付情報2D1は,アセット13の現象文章と対処分類の確率の閾値を,修理員端末12を介して受け取った入力データである。推薦受付情報2D1は,現象文章2D11と推薦確率閾値2D12を備える。なお,本実施形態では現象文章受付部1031が受け付ける推薦受付情報2D1は前記のような項目を備えたが,アセットに関するその他のデータがあってもよいし,推薦確率閾値2D12は省略してもよい。
【0039】
図7を用いて,文章生成装置10の推薦部103の対処推薦部1032が出力する推薦結果2D2を説明する。推薦結果2D2は,現象文章受付部1031に送られてきた現象文章に基づいて,対処推薦部1032が学習済みの推薦モデル1123を用いて算出した,各対処分類IDの対処分類の確率に関する出力データである(後に図15で出力表示例を示す)。推薦結果2D2は,対処分類ID2D21と推薦確率2D21を備える。
【0040】
図8を用いて,文章生成装置10の推薦部103の対処推薦部1032が出力する提示現象文章2D3を説明する。提示現象文章2D3は,現象文章受付部1031に送られてきた現象文章に基づいて,対処推薦部1032が文章生成モデル1122と推薦モデル1123と尤度評価モデル1124を用いて生成した出力データである(後に図15で出力表示例を示す)。文章生成モデル1122が生成した新しい現象文章(生成文章)2D31と,対処分類の確率が最も高い対処分類ID2D32と,その推薦確率2D33を備える。
【0041】
<3.学習フェーズの処理フロー>
次に,図9図10図11を用いて本実施形態における学習フェーズの処理フローを説明する。
【0042】
<3-1.全体フロー>
図9を用いて,全体の流れを説明する。まず,修理履歴受付部1021が,修理員15から修理員端末12を介して送られてきた現象文章と対処分類の組を収集し,修理履歴管理部1011に蓄積する(ステップ1F101)。
【0043】
次に,管理者14は,管理者端末11を介して,現象文章から生成文章を生成する文章生成モデルの学習(ステップ1F102)と,対処分類の確率を出力する推薦モデルの学習(ステップ1F103)と,生成文章の修理履歴の現象文章に対する尤もらしさを出力する尤度表記モデルの学習(ステップ1F104)を実行する。なお,ステップ1F102とステップ1F103とステップ1F104は,順番が前後してもよいし,事前に一部のモデルが学習済みであるならば,そのモデルに関する学習のステップを飛ばしてもよい。なお,各種モデルの学習処理について後述にて詳しく説明する。そして,学習したモデルをモデル管理部1012に保存する。
【0044】
<3-2.文章生成モデルの学習>
次に図10図11を用いて,文章生成モデル1122の学習(ステップ1F102)の処理について詳細を説明する。なお,本実装形態はGANの1つであるConditional GANを用いた形態を示す。そのため,文章生成モデル1122に加え,文章生成モデル1122が生成した生成文章と修理履歴の現象文章とを判別する文章識別モデルも同時に学習させる。文章識別モデルは文章生成モデル1122の学習時のみ使用され、学習が完了した後は不要となるので図示はしていない。なお,本実施形態では,分布間距離にJSD(Jensen-Shannon Divergence)を用いたGANを使用するが,Wasserstein距離を使ったWasserstein GANなどの他のGANを用いてもよい。
【0045】
図10および図11において、文章生成モデル学習部1022は,まず,修理履歴管理部1011の修理履歴1D1(図3)から現象文章1D13と対処分類ID1D14を取り出す。次に,現象文章1D13を形態素解析により単語(例えば名詞や動詞)列に分解する。なお,n-gramやSubwordなどに分割してもよいし,現象文章を構成する部分文字列を用いて単語列に分割してもかまわない。その後,現象文章ごとに,少なくとも1つ以上の単語を含む単語の組合せを少なくとも1つ以上生成する。そして,現象文章と単語の組合せと対処分類IDの組の集合である訓練データ集合1D3(図5)を生成する。この処理を、修理履歴1D1の1または複数の修理ID1D11のデータ(処理時間等を無視した場合,理想的には全データ)について行う(ステップ1F1021)。
【0046】
訓練データ集合1D3は,推薦フェーズにて修理員端末12から送られてきた現象文章とその現象文章から生起されうる文章の組を疑似的に生成したものである。送られてきた現象文章は単語の組合せを表しており,これらの単語の組み合わせから元の現象文章に近い種々の表現を網羅的に生成できる。種々の表現はあいまいなものや元の現象文章に近いものを含むことができる。例えば、図5の1行目の「部位xのオイルリーク」からは「部位x」、「オイルリーク」、「部位x」と「オイルリーク」の単語の組み合わせが得られる。
【0047】
よって,送られてきた現象文章に関連する別の文章は,現象文章から得られた単語の組み合わせから生成することができる。本実装形態の文章生成モデル1122は,この訓練データ集合1D3を用いて,送られてきた現象文章の単語(たとえば「オイルリーク」)から生起されうる文章(たとえば「部位xのオイルリーク」「部位yのオイルリーク」「部位zのオイルリーク」「オイルリーク;部位x」)の生成を学習することができる。学習された文章生成モデル1122は,送られてきた現象文章の単語の組み合わせを入力として,新しい現象文章(生成文章)を生成することができる。すなわち,文章生成モデル1122は現象文章に近い多様な文章を生成する機能を持つ。
【0048】
次に,訓練データ集合1D3(図5)から現象文章1D31と単語の組合せ1D33と対処分類ID1D32の組をサンプリングする。そして,単語の組合せ1D33と対処分類ID1D32の組から,単語の組合せと対処分類IDとノイズの組を生成する。次に,単語の組合せと対処分類IDとノイズの組を文章生成モデル1122に入力し,新しい現象文章(生成文章)の集合を生成する(ステップ1F1022)。ここで,ノイズは正規分布や一様分布に従うものとする。ノイズが入力されているため,文章生成モデル1122は,入力に基づいた多種多様な生成文章を生成できる。
【0049】
次に,対処分類IDと,訓練データ集合1D3からサンプリングした現象文章(生成文章の元になっている訓練データ集合1D3の現象文章)1D31または生成文章の組を文章識別モデルに入力し,入力した文章がサンプリングした現象文章か否かを判別する(ステップ1F1023)。ここで,対処分類IDを文章識別モデルに入力する理由は,文章生成モデルと文章識別モデルに与える情報を公平にすることで,円滑な学習を促進するためである。なお本実施形態では,文章識別モデルは,入力された文章が,訓練データ集合1D3からサンプリングした現象文章となる確率を出力する。確率は現象文章か否かを示す2値でもよいし、たとえば0~1の連続値でもよい。
【0050】
本実施例では,Conditional GANと呼ばれる技術を適用することで,特定の対処分類IDに属する可能性の高い文章を生成する。このため,学習時には単語の組合せとノイズに加えて対処分類ID(Condition)を文章生成モデル1122に入力する。これにより,運用時には対処分類IDを入力することで,特定の対処分類IDに対応する可能性の高い生成文章を出力することができる。
【0051】
次に,生成文章が入力した単語の組合せを含むか否かを判別する(ステップ1F1024)。なお,本実施形態では,生成文章に入力した単語の組合せを含む場合は0,含まない場合は1を出力する関数を用いる。値は2値でもよいし、含む度合いに対応した連続値でもよい。生成文章と単語の組合せの標準化レーヴェンシュタイン距離やコサイン類似度など2つの文章を比較できる指標を用いてもよい。
【0052】
次に,文章識別モデルが訓練データ集合1D3からサンプリングした現象文章と生成文章を判別できないことを良しとする評価指標と,新しい現象に関する文章に入力した単語の組合せを含むことを良しとする評価指標の重み付け和した目的関数に基づいて文章生成モデルのパラメータを更新する(1F1025)。
【0053】
なお,文章識別モデルは予め学習済みでも良いが,文章生成モデルと同時あるいは交互に学習を進めることで、文章生成モデルの学習を効率的に進めることができる。
【0054】
生成文章に入力した単語の組合せを含むことを良しとする評価指標を用いることで,送られてきた現象文章と近いが異なる文章が生成されやすくなる。これにより,修理員15が入力した現象文章に関連する他の表現による生成文章が生成されやすくなる。なお,本実施形態において,文章生成モデル1122の目的関数は,生成文章を入力したときに文章識別モデルから出力される現象文章となる確率を1から引いた値の対数と,生成文章に入力した単語の組合せを含む場合は0,含まない場合は1を出力する関数の値の重み付き和を最小化する関数を用いる。なお,本実施形態では,重み付き和の重みは全て0.5とするが,評価指標ごとに重み付きの重みを変えてもよい。
【0055】
一方,文章識別モデルが現象文章と生成文章を判別できることを良しとする目的関数を用いて文章識別モデルのパラメータを更新する。なお,本実施形態において,文章識別モデルの目的関数は,現象文章を入力したときに文章識別モデルから出力される現象文章となる確率の対数に-1を掛けた値と,生成文章を入力したときに文章識別モデルから出力される現象文章となる確率を1から引いた値の対数に-1を掛けた値との和を最小化する関数を用いる。
【0056】
その後,終了条件を満たしているか確認する。本実施形態では,10000回パラメータを更新したとき終了条件を満たしたものとする。終了条件を満たしていない場合は,ステップ1F1022に戻る。終了条件を満たした場合は,文章生成モデルの学習処理を終了する(ステップ1F102)。なお,終了条件は,文章生成モデルまたは文章識別モデルの出力が変化しなくなったタイミングで終了と見做すなどでもよい。
【0057】
以上の実施例では,文章生成モデルの学習にGANを利用している。前述のように,文章生成モデル1122は,現象文章と類似しているが異なる生成文章を,ノイズを用いて生成する。学習時には,文章生成モデル1122と現象文章と生成文章を識別する識別モデルを,対戦させながら学習させる。これにより,ノイズを用いて現象文章に似た多種多様な文章を生成するモデルを学習することができる。ただし,この技術はモード崩壊という課題がある。モード崩壊は,入力のノイズによらず,本物の文章生成の中で最頻出する文章だけを出力してしまい,多種多様な文章を生成できないという現象である。そこで,実施例の文章生成モデル1122では,出力に入力した単語の組合せを含むことを良しとする評価指標を学習させることで,多種多様な文章を網羅的に生成することを可能としている。
【0058】
<3-3.推薦モデルの学習>
次に,推薦モデルの学習(ステップ1F103)の処理について詳細を説明する。まず,修理履歴管理部1011の修理履歴1D1(図3)から現象文章1D13と対処分類ID1D145を取り出す。そして,現象文章1D13と対処分類ID145に基づいて対処分類の確率を出力する推薦モデル1123を構築する。なお,本実施形態では推薦モデルにSVM(Support Vector Machine)を使用するが,単純ベイズ分類器やニューラルネットなどのモデルを使用してもよい。いずれのモデルも公知のため、詳細な説明は割愛する。
【0059】
<3-4.尤度評価モデルの学習>
次に,尤度評価モデルの学習(ステップ1F104)の処理について詳細を説明する。まず,修理履歴管理部1011の修理履歴1D1(図3)から現象文章1D13を取り出す。次に,現象文章1D13に基づいて現象文章の分布を学習し,入力された文章の修理履歴の現象文章に対する尤もらしさを出力する尤度評価モデルを構築する。なお,本実施形態ではn-gram言語モデルを使用するが,隠れマルコフモデルや最大エントロピーモデルなどを使用してもよい。いずれのモデルも公知のため、詳細な説明は割愛する。
【0060】
<4.推薦フェーズの処理フロー>
図12を用いて本実施形態における推薦フェーズの処理フローを説明する。まず,修理員15は修理員端末12を介して,アセット13の現象文章と対処分類の確率の閾値を現象文章受付部1031に送る(ステップ1F201)。ここで,対処分類の確率の閾値には,例えば修理員15が,対処分類の確率がある値を超えた対処分類を実施するといった方針で数値などを入力する。本実施形態では,0.8を対処分類の確率の閾値とする。
【0061】
次に,対処推薦部1032が,送られてきた現象文章と,生成する文章の対処分類IDと,ノイズの組を,モデル管理部1012で管理している文章生成モデル1122に繰り返し入力して,少なくとも1つ以上の新しい現象に関する文章(生成文章)を生成する。必要により,現象文章は形態要素解析により文字列に分解する前処理を行う(ステップ1F202)。
【0062】
本実施例では,ステップ1F202において,修理履歴管理部1011で管理している対処分類情報1D2(図4)に含まれる対処分類IDごとに,対処分類IDと送られてきた現象文章とノイズを文章生成モデル1122に入力する。例えば,図4では対処分類IDが4種類あるので,対処分類ID1~4のそれぞれに対して現象文章とノイズを文章生成モデル1122に入力して出力を得る処理を100回繰り返し,合計400通りの生成文章を生成する。入力を繰り返す理由は,同じ現象文章と対処分類IDでもノイズにより出力が違うので出力のバリエーションを増やすためである。なお,生成する個数はあらかじめ決めた値でもよいし,実行時のコンピュータリソースや修理員15への応答時間要求などに基づいて動的に決めた値でもよい。このようにして,文章生成モデル1122は,入力された現象文章から似て非なる文章を生成するように機能する。
【0063】
次に,対処推薦部1032は,送られてきた現象文章を,モデル管理部1012で管理している推薦モデル1123に入力して,対処分類の確率を算出する。推薦モデル1123の出力は,入力に対する対処分類と対処分類の確率の組となる。例えば、(対処分類ID
1:70%、対処分類ID2:20%、対処分類ID3:10%)のように出力される。その後,対処推薦部1032は,送られてきた現象に関する文章と対処分類とその確率の組を生成する。
【0064】
また,対処推薦部1032は,少なくとも1つ以上の生成文章をモデル管理部1012で管理している推薦モデル1123に入力して,同様に対処分類の確率を算出する。その後,対処推薦部1032は,少なくとも1つ以上の生成文章と対処分類とその確率の組を生成する。(ステップ1F203)。
【0065】
次に,対処推薦部1032は,少なくとも1つ以上の生成文章をモデル管理部1012で管理している尤度評価モデル1124に入力して,修理履歴の現象文章に対する尤もらしさを算出する。出力はたとえば0~1の連続値で表される尤度である。その後,対処推薦部1032は,少なくとも1つ以上の生成文章とその現象文章に対する尤もらしさの組を生成する(ステップ1F204)。なお、ステップ1F203とステップ1F204の順序は逆転していても構わない。
【0066】
ステップ1F203で生成されたデータの組とステップ1F204で生成されたデータの組は、生成文章を介して関連付けることができる。すなわち,ある生成文章に対して,その生成文章の尤度と,1または複数の対処分類およびその確率がデータの組として関連付けられる。このデータの組を,「提示現象候補データ」と呼ぶことにする。
【0067】
次に,対処推薦部1032は,送られてきた現象文章に対して,対処分類とその確率の組を,対処分類の確率の高い順に並び替えた推薦結果2D2(図7)を生成する。
【0068】
加えて,対処推薦部1032は,提示現象候補データから,対処分類の確率が対処分類の確率の閾値以下の対処分類およびその確率を削除する。ある生成文章に対して関連付けられている1または複数の対処分類の確率が全て閾値以下の場合は,そのデータの組ごと削除する。残った提示現象候補データで,ある生成文章に対して関連付けられている対処分類が複数ある場合には,確率が最大の対処分類を残して他の対処分類を削除する。そして残った提示現象候補データから,修理履歴の現象文章に対する尤もらしさが大きい上位1もしくは複数件の生成文章と対処分類およびその確率の組を生成する。
【0069】
その後,対処推薦部1032は,上位1もしくは複数件の生成文章と対処分類の確率の組を,対処分類ごとに対処分類の確率が高い順に並び替えた提示現象文章2D3(図8)を生成する(ステップ1F205)。
【0070】
対処に関する分類の確率の閾値より大きい現象文章のなかで,尤度が大きい文章と対処分類の確率の高い組を選別することにより,対処に関する分類の確率が高く,かつ品質が担保された文章を提示することができる。
【0071】
そして,対処表示部1033が,対処分類情報1D2により推薦結果2D2と提示現象文章2D3の対処分類IDを対処分類に変換した結果を修理員15に修理員端末12を介して表示する(ステップ1F206)。
【0072】
以上のように,文章生成装置10が,修理員端末12を介して集めた修理履歴に基づいて送られてきた現象文章に対する対処分類を推薦する。これにより,修理員15は,アセット13の故障を適切に修理することができる。また,文章生成装置10は,送られてきた現象文章と近いが異なる別の現象に関する文章(生成文章)を修理員15に提示現象文章として提示する。これにより,修理員15は,提示現象文章の中からアセット13に発生している現象に関する文章を選び,その現象に関する文章と紐づけられた対処分類を行うことで,適切に修理することができる。なお,提示現象文章を提示する処理は,送られてきた現象文章から適切な対処分類を推薦出来ない場合にのみ行ってもよい。例えば、現象文章から推薦される複数の対処分類の推薦確率に差がない場合である。
【0073】
<5.ユーザインターフェース>
図13を用いて,学習フェーズにおいて,修理員15が修理員端末12を介して修理履歴受付部1021に対して修理履歴1D1(図3)を送信するために使う,修理履歴受付部1021の修理履歴入力画面1G1を説明する。
【0074】
修理履歴入力画面1G1は,修理日時ボックス1G101と,現象文章ボックス1G102と,対処分類セレクトボックス1G103と,登録ボタン1G104を備える。
【0075】
修理日時ボックス1G101には,修理の日時を入力する。現象文章ボックスには1G102には,対処する前に発生していたアセット13の現象に関する文章(現象文章)を入力する。対処分類セレクトボックス1G103は,実施した対処に関する分類(対処分類)を入力する。この項目は修理履歴管理部1011の対処分類情報1D2の対処分類1D22がプルダウン形式で表示されている。修理員15が対処分類を選択した場合,選択した対処分類に対応した対処分類ID1D21が入力する値となる。登録ボタン1G104を押すことで,入力したデータを修理履歴受付部1021に送信できる。なお,本実施形態では,修理履歴1D1の項目を入力するための修理日時ボックス1G101と現象文章ボックス1G102と対処分類セレクトボックス1G103を備えるが,アセット13に関するその他のデータを入力するフォームがあってもよいし,前記項目の一部項目のみを入力するフォームを備えたものであってもよい。
【0076】
なお,本実施形態では,ボックスとセレクトボックスを入力フォームに使用するが,どちらか一方のフォームだけでも良いし,チェックリストやラジオボタンなど他の入力フォームであっても良い。
【0077】
図14を用いて,推薦フェーズにおいて,修理員15が修理員端末12を介してアセット13に関する現象に関する文章(現象文章)と対処に関する分類(対処分類)の確率の閾値を入力するために使う現象文章受付部1031の現象文章受付画面1G2を説明する。
【0078】
現象文章受付画面1G2は,現象文章ボックス1G201と,推薦確率閾値ボックス1G202と,送信ボタン1G203を備える。現象文章ボックス1G201には,対処分類を推薦して欲しいアセット13の現象文章を入力する。推薦確率閾値ボックス1G202には,推薦確率の閾値を入力する。送信ボタン1G203を押すことで,入力した推薦受付情報2D1を現象文章受付部1031に送信できる。
【0079】
図15を用いて,推薦フェーズにおいて,対処表示部1033が,修理員端末12を介して修理員15に表示する結果表示画面1G3を説明する。
【0080】
結果表示画面1G3は,推薦結果表示領域1G301と提示現象文章表示領域1G302を備える。推薦結果表示領域1G301の表示内容は,推薦部103の対処推薦部1032が出力する推薦結果2D2(図7)に基づく。提示現象文章表示領域1G302の表示内容は,推薦部103の対処推薦部1032が出力する提示現象文章2D3(図8)に基づく。
【0081】
推薦結果表示領域1G301は,対処推薦部1032が対処分類情報1D2(図4)により推薦結果2D2(図7)の対処分類IDを対処に関する分類に変換した結果を表示する。推薦結果表示領域1G301は,順位表示領域1G3011と対処表示領域1G3012と推薦確率表示領域1G3013を備える。順位表示領域1G3011には,対処に関する分類の確率が高い順に対処分類を並び替えたときの順位を表示する。対処表示領域1G3012には,送られてきた現象文章に対する対処分類を表示する。
【0082】
推薦確率表示領域1G3013には,送られてきた現象文章に対する対処分類の確率を表示する。なお,本実施形態では,対処分類の確率の高い上位3件を推薦結果として表示しているが,全ての対処分類に対して表示してもよいし,対処分類の確率があらかじめ決めた値を超えた対処分類だけを表示してもよい。
【0083】
提示現象文章表示領域1G302は,対処推薦部1032が対処分類情報1D2(図4)により提示現象文章2D3(図8)の対処分類IDを対処分類に変換した結果を表示する。提示現象文章表示領域1G302は,提示現象文章1G3021と,提示現象文章の対処分類1G3022と,提示現象文章の推薦確率1G3023を備える。提示現象文章1G3021には,対処推薦部1032が生成した新しい現象に関する文章(生成文章)を表示する提示現象文章の対処分類1G3022には,対処推薦部1032が生成した生成文章の対処分類の確率が最も高い対処分類を表示する。提示現象文章の推薦確率1G3023には,対処推薦部1032が生成した生成文章の対処分類の確率を表示する。なお,本実施形態では,対処推薦部1032が出力した結果を全て表示しているが,対処分類ごとに1件だけ表示してもよいし,あらかじめ決めた件数だけ表示してもよい。
【0084】
なお,本実施形態では,送られてきた現象文章に対して推薦する対処分類だけを表示しているが,表示する対処分類に修理手順書等のファイルやURLを付与することで対処分類の詳細を表示できるようにしてもよい。
【0085】
なお,本実施形態では,推薦結果表示領域と提示現象文章表示領域の両方を表示したが,推薦結果の対処分類の確率が対処分類の確率の閾値を超えていた場合は提示現象文章を表示しないといったように,どちらか一方だけを表示してもよい。また,画面を切り替えて推薦結果表示領域と提示現象文章表示領域を選択できるようにしてもよい。
【0086】
以上に説明したように,本実施例によれば,修理履歴の現象文章に近く,かつ送られてきた現象文章下で生起する確率の高い文章を生成するように文章生成モデルを学習させる。このことにより,送られてきた現象文章と近いが異なる現象文章が生成され,修理員が入力した現象文章に関連した別の現象文章(生成文章)が生成されやすくなる。
【0087】
生成文章は,送られてきた現象文章から想定されうる文章を網羅できるので、多様な文章集合が生成できる。また,生成文章は修理履歴の現象文章に近いものが生成されるので,過去の現象文章の分布とは大きく異なる表現の文章が除外される。よって、多言語が混在したり、特殊な表現の表記が含まれたりする生成文章が除かれる。
【0088】
また,送られてきた現象文章と文章生成モデルを使って生成文章を生成した後,対処分類の確率の閾値より大きい生成文章のなかで修理履歴の現象文章に対する尤もらしさが大きい上位1もしくは複数件の生成文章と対処分類の確率の組を選別する手順を取ることにより,対処分類の確率が高く,かつ品質が担保された文章を提示することができる。
【符号の説明】
【0089】
10 …… 文章生成装置
101…… 管理部
1011……修理履歴管理部
1012……モデル管理部
102…… 学習部
1021……修理履歴受付部
1022……文章生成モデル学習部
1023……推薦モデル学習部
1024……尤度評価モデル学習部
103…… 推薦部
1031……現象文章受付部
1032……対処推薦部
1033……対処表示部
11 …… 管理者端末
12 …… 修理員端末
13 …… アセット
14 …… 管理者
15 …… 修理員
16 …… ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15