(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-10
(45)【発行日】2024-06-18
(54)【発明の名称】分析装置に関する質問への応答を生成する方法、システム、および装置
(51)【国際特許分類】
G06F 16/90 20190101AFI20240611BHJP
【FI】
G06F16/90 100
(21)【出願番号】P 2022530029
(86)(22)【出願日】2021-03-05
(86)【国際出願番号】 JP2021008585
(87)【国際公開番号】W WO2021250954
(87)【国際公開日】2021-12-16
【審査請求日】2022-12-06
(31)【優先権主張番号】P 2020101522
(32)【優先日】2020-06-11
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】森本 健太郎
【審査官】鹿野 博嗣
(56)【参考文献】
【文献】特開2006-072787(JP,A)
【文献】特開2019-191827(JP,A)
【文献】社内ヘルプデスクからカスタマーセンターまで! AI FAQ支援サービス Knowledge Discovery,シーテック 2019,日本,2019年10月15日
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
分析装置に関する質問に対する応答を生成する方法であって、
コンピュータにより前記質問の入力を受け付けるステップと、
前記分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、前記質問から前記応答を推論するステップと、
前記応答を出力するステップと、
前記マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換するステップと、
変換された前記質問応答データに含まれる質問を前記応答推論モデルの入力とし、当該質問応答データに含まれる応答を前記応答推論モデルの出力の正解データとする教師あり学習によって学習済みの前記応答推論モデルを生成するステップとを含む、方法。
【請求項2】
前記特定自然言語の分散表現を生成可能であり、前記質問応答データに変換する変換モデルを準備するステップ
を含み、前記変換モデルは、前記マニュアルデータに含まれる手順を前記質問応答データに変換し、前記方法はさらに、
前記分析装置に関する手順と当該手順に対応する質問応答データとが関連付けられた教師データを準備するステップと、
前記教師データを用いて、前記教師データの手順を前記変換モデルの入力とし、前記教師データの質問応答データを前記変換モデルの出力の正解データとして、前記変換モデルについて教師あり学習を行うステップとを含み、
学習済みの前記応答推論モデルを生成するステップは、学習済みの前記変換モデルから出力される質問応答データに含まれる質問を前記応答推論モデルの入力とする、請求項1に記載の方法。
【請求項3】
前記変換モデルおよび前記応答推論モデルの各々は、前記特定自然言語の分散表現が事前学習された特定モデルを含み、
前記変換モデルおよび前記応答推論モデルの各々に対する教師あり学習は、前記特定モデルに対するファインチューニングとして行われる、請求項2に記載の方法。
【請求項4】
前記特定モデルに対して、前記マニュアルデータと、前記分析装置に関する質問応答データとを用いる追加学習を行うステップをさらに含む、請求項3に記載の方法。
【請求項5】
分析装置に関する質問に対する応答を生成するシステムであって、
前記質問の入力を受け付ける端末装置と、
前記端末装置から前記質問を受信し、前記応答を前記端末装置に送信するサーバ装置とを備え、
前記サーバ装置は、前記分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、前記質問から前記応答を推論する推論部と、
前記マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換する変換部と、
変換された前記質問応答データに含まれる質問を前記応答推論モデルの入力とし、当該質問応答データに含まれる応答を前記応答推論モデルの出力の正解データとする教師あり学習によって学習済みの前記応答推論モデルを生成する学習部とを含む、システム。
【請求項6】
分析装置に関する質問に対する応答を生成する装置であって、
前記質問の入力を受け付ける入出力部と、
前記分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、前記質問から前記応答を推論し、前記応答を前記入出力部に出力する推論部と、
前記マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換する変換部と、
変換された前記質問応答データに含まれる質問を前記応答推論モデルの入力とし、当該質問応答データに含まれる応答を前記応答推論モデルの出力の正解データとする教師あり学習によって学習済みの前記応答推論モデルを生成する学習部とを含む、装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析装置に関する質問への応答を生成する方法、システム、および装置に関する。
【背景技術】
【0002】
従来、装置のマニュアルからユーザが必要とする当該装置に関する情報を検索する構成が知られている。たとえば、特開2019-125220号公報(特許文献1)には、検索端末から入力された検索ワードを用いて、電話機のマニュアルデータから当該電話機の設定を検索するマニュアル検索システムが開示されている。当該マニュアル検索システムによれば、複数の電話機による各設定の関連性が学習されて当該設定のスコア値が計算されることにより、一連の設定が検索される場合の検索回数を減らすことができ、ユーザの検索に要する時間および手間を短縮することができる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
分析装置による精密な分析を実現するには、多くの手順を要する場合が多い。そのため、分析装置のマニュアルデータには膨大な情報が含まれ得る。一方で、マニュアルデータに含まれる手順は一般的な状況における手順であることが多いため、必ずしもユーザが解決を望む状況に関する情報がマニュアルデータに集約されているとは限らない。
【0005】
分析装置のマニュアルデータからユーザが所望の情報を見つけられない場合に、様々なユーザから実際に問い合わされた質問と当該質問に対する応答との組合せ(質問応答データ)がまとめられた質問応答コレクションデータ(たとえばFAQ(Frequently Asked Questions))が参照される場合がある。しかし、或る質問に対して質問応答コレクションデータから取得される応答は断片的である場合が多いため、所望の情報を得るためには、ユーザはマニュアルデータおよび質問応答コレクションデータに対する検索を繰り返す必要がある。
【0006】
分析装置のマニュアルデータおよび質問応答コレクションデータに膨大な情報が含まれる場合、分析装置のマニュアルデータおよび質問応答コレクションデータの各々、ならびに分析装置のマニュアルデータおよび質問応答コレクションデータの間において表記ゆれ(同じ意味で使用されている用語の不一致)が生じ易い。そのため、ユーザは、様々な検索キーワードを用いて所望の情報を検索する必要が生じる。その結果、所望の情報を効率的に取得することが困難になり得る。
【0007】
本発明は、このような課題を解決するためになされたものであって、その目的は、分析装置に関する質問に対応する応答を自動的に提供することである。
【課題を解決するための手段】
【0008】
本発明の一局面に係る方法は、分析装置に関する質問に対する応答を生成する。方法は、コンピュータにより質問の入力を受け付けるステップと、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論するステップと、応答を出力するステップとを含む。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。
【0009】
本発明の他の局面に係るシステムは、分析装置に関する質問に対する応答を生成する。システムは、端末装置と、サーバ装置とを備える。端末装置は、質問の入力を受け付ける。サーバ装置は、端末装置から質問を受信し、応答を端末装置に送信する。サーバ装置は、推論部を含む。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。
【0010】
本発明の他の局面に係る装置は、分析装置に関する質問に対する応答を生成する。装置は、入出力部と、推論部とを備える。入出力部は、質問の入力を受け付ける。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論し、応答を入出力部に出力する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。
【発明の効果】
【0011】
本発明に係る方法、システム、および装置によれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対応する応答を自動的に提供することができる。
【図面の簡単な説明】
【0012】
【
図1】実施の形態に係るシステムの一例である分析装置管理システムの構成を示すブロック図である。
【
図2】
図1の情報処理装置および入出力部のハードウェア構成を示すブロック図である。
【
図3】
図1の液体クロマトグラフの構成を示すブロック図である。
【
図4】変換モデルに対するファインチューニングにおいて用いられる教師データの例を示す図である。
【
図5】
図1の学習部によって行われる学習処理の流れを示すフローチャートである。
【
図6】推論部において行われる推論処理の流れを示すフローチャートである。
【
図7】
図1のサーバ装置のハードウェア構成を示すブロック図である。
【
図8】
図1のユーザの質問および当該質問に対応する応答がディスプレイに表示されている様子を示す図である。
【
図9】実施の形態の変形例に係るLC分析システムの構成を示すブロック図である。
【
図10】
図9の情報処理装置のハードウェア構成を示すブロック図である。
【発明を実施するための形態】
【0013】
以下に、実施の形態について図面を参照して詳細に説明する。なお、以下では図中の同一または相当部分には同一符号を付してその説明は原則的に繰返さない。
【0014】
図1は、実施の形態に係るシステムの一例である分析装置管理システム1000の構成を示すブロック図である。
図1に示されるように、分析装置管理システム1000は、液体クロマトグラフ(LC:Liquid Chromatograph)分析システム100と、分析装置管理サーバ400とを含む。LC分析システム100は、液体クロマトグラフ110(分析装置)と、情報処理装置120(端末装置)と、入出力部130とを含む。分析装置管理サーバ400は、サーバ装置200と、データベース300とを含む。
【0015】
情報処理装置120は、パーソナルコンピュータまたはワークステーションを含む。情報処理装置120は、ネットワークNWを介して、サーバ装置200に接続されている。ネットワークNWは、たとえばインターネット、WAN(Wan Area Network)、またはLAN(Lan Area Network)を含む。情報処理装置120は、液体クロマトグラフ110に接続されている。情報処理装置120には、液体クロマトグラフ110の制御およびサーバ装置200との通信を行うLC分析アプリケーションがインストールされている。ユーザRs1は、LC分析アプリケーションを介して、液体クロマトグラフ110を操作する。なお、情報処理装置120に複数の液体クロマトグラフ110が接続されていてもよい。情報処理装置120に、液体クロマトグラフ以外の分析装置(たとえば質量分析装置)が接続されていてもよい。また、分析装置管理サーバ400に複数の分析システムが接続されてもよい。分析装置管理サーバ400によって管理される分析装置は、液体クロマトグラフに限定されず、たとえば質量分析装置であってもよい。
【0016】
データベース300は、液体クロマトグラフ110のマニュアルデータ301と、液体クロマトグラフ110の質問応答コレクションデータ302とを含む。マニュアルデータ301は、液体クロマトグラフ110に関する手順を含む。当該手順は、液体クロマトグラフ110に関する順序付けられた複数の操作を含む。質問応答コレクションデータ302には、液体クロマトグラフ110の様々なユーザから実際に問い合わされた内容がまとめられたFAQが含まれる。ユーザRs1は、LC分析アプリケーションを介して、マニュアルデータ301および質問応答コレクションデータ302を参照および検索することができる。なお、データベース300は、サーバ装置200内に形成されていてもよいし、ネットワークNWを介してサーバ装置200に接続されていてもよい。
【0017】
図2は、
図1の情報処理装置120および入出力部130のハードウェア構成を示すブロック図である。
図2に示されるように、情報処理装置120は、プロセッサ121と、記憶部としてのメモリ122およびハードディスク123と、通信インターフェース124とを含む。これらは、バス125を介して相互に通信可能に接続されている。
【0018】
ハードディスク123は、不揮発性の記憶装置である。ハードディスク123には、たとえばオペレーティングシステム(OS:Operating System)のプログラム41、およびLC分析アプリケーションのプログラム42が保存されている。
図2に示されるデータ以外にも、ハードディスク123には、たとえば各種アプリケーションの設定および出力、ならびに検出器18からの検出データが保存される。メモリ122は、揮発性の記憶装置であり、たとえばDRAM(Dynamic Random Access Memory)を含む。
【0019】
プロセッサ121は、CPU(Central Processing Unit)を含む。プロセッサ121は、GPU(Graphics Processing Unit)をさらに含んでもよい。プロセッサ121は、ハードディスク123に保存されているプログラムをメモリ122に読み込んで実行する。プロセッサ121は、通信インターフェース124を介してネットワークNWに接続する。
【0020】
入出力部130は、ディスプレイ131と、マウス132と、キーボード133と、スピーカフォン134とを含む。スピーカフォン134は、マイク1341およびスピーカ1342を含む。ディスプレイ131、マウス132、キーボード133、およびスピーカフォン134の各々は、情報処理装置120に接続されている。ディスプレイ131には、LC分析アプリケーションのGUI(Graphical User Interface)が表示される。ユーザRs1は、ディスプレイ131の表示を参照しながら、キーボード133の操作、マウス132の操作、またはスピーカフォン134への音声入力によって、LC分析アプリケーションへ所望の入力を行う。LC分析アプリケーションは、スピーカフォン134を介して音声を出力することができる。
【0021】
図3は、
図1の液体クロマトグラフ110の構成を示すブロック図である。
図3に示されるように、液体クロマトグラフ110は、制御部10と、溶離液(移動相)槽11と、送液ポンプ12と、オートサンプラ13と、カラムオーブン16と、検出器18と、コレクタ19とを含む。オートサンプラ13には、複数のバイアル瓶15が搭載されたサンプルラック14が設置されている。カラムオーブン16内にはカラム17が設置されている。情報処理装置120は、制御部10を介して、送液ポンプ12、オートサンプラ13、カラムオーブン16、および検出器18の各々を制御し、液体クロマトグラフ110による分析作業の管理、および検出器18において得られたデータの解析等を行う。
【0022】
送液ポンプ12は、溶離液槽11から溶離液を略一定流量で吸引し、オートサンプラ13を介してカラム17に流す。オートサンプラ13においては、前処理が行われた後のバイアル瓶15内の試料溶液が溶離液中に注入される。当該試料溶液は溶離液とともにカラム17へと導入される。試料溶液中の複数の成分の各々がカラム17を通過する時間(保持時間)が成分毎に異なるため、カラム17を通過する間に試料溶液中の各成分は時間的に分離される。検出器18は、カラム17により分離されて溶出する成分を順次検出し、検出されたデータを制御部10を介して情報処理装置120へ送信する。検出器18から流出する溶離液はコレクタ19に排出される。検出器18から流出する溶離液は、他の分析装置(たとえば質量分析装置)に入力されてもよい。
【0023】
液体クロマトグラフ110による精密な分析を実現するには、多くの手順を要する場合が多い。そのため、液体クロマトグラフ110のマニュアルデータ301には膨大な情報が含まれる。一方で、マニュアルデータ301に含まれる手順は一般的な状況における手順であることが多いため、必ずしもユーザRs1が解決を望む状況に関する情報がマニュアルデータ301に集約されているとは限らない。
【0024】
たとえば、液体クロマトグラフ110によって可能な分析方法として、試料溶液中のイオン種成分を分離して定量するイオンクロマトグラフィーを挙げることができる。イオンクロマトグラフィーは、環境水中の無機イオンの測定のために開発され、環境水または排水等の水質管理、大気環境測定、および食品分野などの品質管理等に適用可能な分析方法である。イオンクロマトグラフィーの分析対象となるイオンの種類が多種であることに加え、イオンクロマトグラフィーには前処理も必要となる。そのため、液体クロマトグラフ110のマニュアルデータ301を参照して液体クロマトグラフ110の操作を覚えただけでは、イオンクロマトグラフィーを液体クロマトグラフ110によって実施することができない。
【0025】
液体クロマトグラフ110のマニュアルデータ301からユーザRs1が所望の情報を見つけられない場合に、質問応答コレクションデータ302が参照される場合がある。しかし、或る質問に対して質問応答コレクションデータ302から取得される応答は断片的である場合が多いため、所望の情報を得るためには、ユーザRs1はマニュアルデータ301および質問応答コレクションデータ302に対する検索を繰り返す必要がある。
【0026】
マニュアルデータ301および質問応答コレクションデータ302に膨大な情報が含まれる場合、マニュアルデータ301および質問応答コレクションデータ302の各々、ならびに液体クロマトグラフ110のマニュアルデータ301および質問応答コレクションデータ302の間において表記ゆれが生じ易い。そのため、ユーザRs1は、様々な検索キーワードを用いて所望の情報を検索する必要が生じる。その結果、所望の情報を効率的に取得することが困難になり得る。
【0027】
そこで、分析装置管理システム1000においては、マニュアルデータ301および質問応答コレクションデータ302を用いる機械学習によって生成された学習済みの応答推論モデルを用いて、ユーザRs1から入力される質問に対する適切な応答を推論する。分析装置管理システム1000によれば、ユーザRs1は、質問内容に関する表記ゆれを想定する必要がなく、ユーザRs1にとって使いやすい用語によって作成された質問によって、所望の情報を含む応答を自動的に得ることができる。
【0028】
再び
図1を参照して、LC分析アプリケーションは、液体クロマトグラフ110に関する質問に対する応答を生成する機能(質問応答機能)を有する。ディスプレイ131には、LC分析アプリケーションの質問応答機能に関するGUIであるキャラクタAc1およびUc1が表示されている。キャラクタAc1は、サーバ装置200によって実現されるAI(Artificial Intelligence)アシスタントに対応する。キャラクタUc1は、ユーザRs1に対応する。ユーザRs1は、液体クロマトグラフ110に関する質問「カラムの取り付け方がわからない。」をスピーカフォン134に音声入力している。当該質問は、キーボード133から文字入力されてもよい。情報処理装置120は、当該質問の入力を受け付けてネットワークNWを介してサーバ装置200に送信する。
【0029】
サーバ装置200は、通信部201と、推論部202と、変換部203と、学習部204とを含む。推論部202は、応答推論モデル44を用いて情報処理装置120から受信した質問から当該質問に対応する応答を推論し、当該応答を通信部201を介して情報処理装置120に送信する。変換部203は、変換モデル45を用いてマニュアルデータ301に含まれる液体クロマトグラフ110に関する手順を、当該手順に対応する質問応答データに変換する。応答推論モデル44および変換モデル45は、予め準備されている。具体的には、応答推論モデル44および変換モデル45の各々は、マニュアルデータ301に対応する特定自然言語の分散表現(ベクトル表現)が事前学習された特定モデルを含み、ニューラルネットワークとして形成される。なお、マニュアルデータ301に対応する特定自然言語とは、マニュアルデータ301に含まれる情報を表現するのに使用されている自然言語である。特定モデルが事前学習されていることにより、応答推論モデル44および変換モデル45に対する機械学習に要するコストを低減することができるとともに、応答推論モデル44の推論精度を向上させることができる。
【0030】
特定モデルの事前学習においては、特定自然言語の大量の文書データが体系化された言語資料であるコーパスが使用される。当該コーパスは、マニュアルデータ301および質問応答コレクションデータ302のような液体クロマトグラフに関する情報を含んでいなくてもよい。当該特定モデルとしては、たとえばBERT(Bidirectional Encoder Representations from Transformers)モデル、CBOW(Continuous Bag-of-Words)モデル、あるいはskip-gramモデルを挙げることができる。
【0031】
応答推論モデル44および変換モデル45の各々は、特定モデルに対する追加学習およびファインチューニングによって生成された学習済みモデルである。特定モデルに対する追加学習により、特定モデルによって生成される分散表現にマニュアルデータおよび質問応答データに含まれる特定自然言語の語彙の傾向を反映させることができるため、応答推論モデル44の推論精度をさらに向上させることができる。また、特定モデルに対するファインチューニングにより、応答推論モデル44の推論精度をさらに向上させることができる。
【0032】
学習部204は、形態素解析を含む自然言語処理によって、応答推論モデル44および変換モデル45の各々に対して追加学習およびファインチューニングを行い、応答推論モデル44および変換モデル45の各々を学習済みモデルとする。学習部204は、自然言語処理において、学習部204は、追加学習において、マニュアルデータ301および質問応答コレクションデータ302を用いる教師なし学習を行う。なお、形態素解析とは、文書データを最小の言語単位(形態素あるいは単語)に分割する処理である。
【0033】
学習部204は、変換モデル45に対するファインチューニングにおいて、マニュアルデータ301に含まれる手順と当該手順に対応する質問応答データとが関連付けられた教師データを用いて、当該教師データの手順を変換モデル45の入力とし、当該教師データの質問応答データを変換モデル45の出力の正解データとする教師あり学習を行う。当該教師データは、予め準備されている。当該教師データは、自動的に作成されてもよいし、手作業によって作成されてもよい。
【0034】
学習部204は、応答推論モデル44に対するファインチューニングにおいて、変換部203から出力される質問応答データに含まれる質問を応答推論モデル44の入力とし、当該質問応答データに含まれる応答を応答推論モデル44の出力の正解データとする教師あり学習を行う。なお、応答推論モデル44に対するファインチューニングにおいては、変換モデル45からの出力に加えて、質問応答コレクションデータ302が用いられてもよい。また、当該ファインチューニングにおいては、変換モデル45からの出力に替えて、質問応答コレクションデータ302が用いられてもよい。この場合、サーバ装置200は、変換部203を含んでいなくてもよい。
【0035】
図4は、変換モデル45に対するファインチューニングにおいて用いられる教師データの例を示す図である。
図4には、教師データSd1,Sd2,Sd3が示されている。教師データSd1~Sd3の各々の液体クロマトグラフ110に関する手順は、マニュアルデータ301に含まれていてもよいし、含まれていなくてもよい。
【0036】
図4に示されるように、教師データSd1には、液体クロマトグラフ110に関して、「カラムオーブンにカラムを取り付ける。」という手順が含まれる。当該手順においては、「1. 送液を停止する。」、「2. カラムオーブンのドアを開ける。」、「3. カラムの出口側を上に向けて、カラムクランプに取り付ける。」、および「4. カラムオーブンの扉を閉める。」という4つの操作がこの順に順序付けられている。教師データSd1の手順に対応する正解データとしての質問応答データは、「どうやってカラムを取り付ければよいか。」という質問、および「送液を停止し、カラムオーブンのドアを開けて、カラムの出口側を上に向けてからカラムをカラムクランプに取り付ける。その後、カラムオーブンのドアを閉める。」という応答の組合せである。
【0037】
教師データSd2には、液体クロマトグラフ110に関して、「試料びんを準備する。」という手順が含まれる。当該手順においては、「1. 移動相と組成が同等の溶媒で、試料を完全に溶解させる。」、「2. 試料をメンブランフィルタでろ過する。」、および「3. 試料びんまたはマイクロプレート、ディープウェルプレートのウェルに試料を充填する。」という3つの操作がこの順に順序付けられている。教師データSd2の手順に対応する正解データとしての質問応答データは、「試料びんの準備はどうすればよいか。」という質問、および「移動相と組成が同等の溶媒で、試料を完全に溶解させる。試料をメンブランフィルタでろ過する。試料びんまたはマイクロプレート、ディープウェルプレートのウェルに試料を充填する。」という応答の組合せである。
【0038】
教師データSd3には、液体クロマトグラフ110に関して、「試料をオートサンプラにセットする。」という手順が含まれる。当該手順においては、「1. サンプルラックを引き出す。」、「2. 試料が充填されたサンプルプレートをサンプルラックにセットする。」、「3. サンプルラックをガイドに沿って水平に奥まで差し込む。」という3つの操作がこの順に順序付けられている。教師データSd3の手順に対応する正解データとしての質問応答データは、「試料をオートサンプラにセットする手順がわからない。」という質問、および「サンプルラックを引き出す。試料が充填されたサンプルプレートをサンプルラックにセットする。サンプルラックをガイドに沿って水平に奥まで差し込む。」という応答の組合せである。
【0039】
図5は、
図1の学習部204によって行われる学習処理の流れを示すフローチャートである。以下ではステップを単にSと記載する。
【0040】
図5に示されるように、学習部204は、S101において応答推論モデル44および変換モデル45に対して追加学習を行い、処理をS102に進める。学習部204は、S102において変換モデル45に対してファインチューニングを行って処理をS103に進める。学習部204は、S103において変換モデル45から出力される質問応答データを教師データとして応答推論モデルに対してファインチューニングを行い、学習処理を終了する。なお、S101の追加学習は必ずしも行われる必要はなく、学習処理がS102から開始されてもよい。
【0041】
図6は、推論部202において行われる推論処理の流れを示すフローチャートである。
図6に示されるように、推論部202は、S201において情報処理装置120から質問を受信し、処理をS202に進める。推論部202は、S202において、応答推論モデル44を用いて、情報処理装置120から受信した質問に対応する応答を推論し、処理をS203に進める。推論部202は、S203において、推論された応答を通信部201を介して情報処理装置120に送信し、処理を終了する。
【0042】
図7は、
図1のサーバ装置200のハードウェア構成を示すブロック図である。
図7に示されるように、サーバ装置200は、プロセッサ210と、記憶部としてのメモリ220およびハードディスク230と、通信部201としての通信インターフェース240と、入出力部250とを含む。これらは、バス260を介して相互に通信可能に接続されている。
【0043】
ハードディスク230は、不揮発性の記憶装置である。ハードディスク230には、たとえばオペレーティングシステム(OS:Operating System)のプログラム51、分析装置管理プログラム52、機械学習プログラム53、機械学習用の学習データ54、事前学習済みの応答推論モデル44、および事前学習済みの変換モデル45が保存されている。学習データ54には、
図4に示されるような教師データが含まれる。
図7に示されるデータ以外にも、ハードディスク230には、たとえば各種アプリケーションの設定および出力が保存される。メモリ220は、揮発性の記憶装置であり、たとえばDRAM(Dynamic Random Access Memory)を含む。
【0044】
プロセッサ210は、CPU(Central Processing Unit)を含む。プロセッサ210は、GPU(Graphics Processing Unit)をさらに含んでもよい。プロセッサ210は、ハードディスク230に保存されているプログラムをメモリ220に読み込んで実行し、サーバ装置200の各種機能を実現する。たとえば、分析装置管理プログラム52を実行するプロセッサ210は、推論部202として機能する。機械学習プログラム53を実行するプロセッサ210は、変換部203および学習部204として機能する。プロセッサ210は、通信インターフェース240を介してネットワークNWに接続する。
【0045】
図8は、
図1のユーザRs1の質問および当該質問に対応する応答がディスプレイ131に表示されている様子を示す図である。
図8に示されるように、ユーザRs1に対応するキャラクタUc1から「カラムの取り付け方がわからない。」という質問Q1が発せられている。質問Q1は、
図1においてユーザRs1がスピーカフォン134に音声入力した質問に対応する。AIアシスタントに対応するキャラクタAc1は、質問Q1に対して、「送液を停止し、カラムオーブンのドアを開けて、カラムの出口側を上に向けてからカラムクランプにカラムを取り付けてください。その後、カラムオーブンのドアを閉めてください。」との応答A1を発している。キャラクタAc1から応答A1が発せられた後、キャラクタUc1から「オートサンプラにはどうやって試料をセットすればいいのだろう?」という質問Q2が発せられている。キャラクタAc1は、質問Q2に対して、「サンプルラックを引き出して、試料が充填されたサンプルプレートをサンプルラックにセットしてください。その後、サンプルラックをガイドに沿って水平に奥まで差し込んでください。」との応答A2を発している。
【0046】
質問Q1は、
図4の教師データSd1の質問とは一致しないが、学習済みの応答推論モデル44によって教師データSd1の応答に類似する応答A1が質問Q1に対応する応答として推論されている。質問Q2は、
図4の教師データSd3の質問とは一致しないが、学習済みの応答推論モデル44によって教師データSd3の応答に類似する応答A2が質問Q2に対応する応答として推論されている。
【0047】
実施の形態においては、応答推論モデル44および変換モデル45の各々が、マニュアルデータ301および質問応答コレクションデータ302を含まないコーパスを用いて事前学習された特定モデルを含む場合について説明した。応答推論モデル44は、当該特定モデルを含んでいる必要はない。応答推論モデル44が当該特定モデルを含んでいない場合、応答推論モデル44および変換モデル45は、マニュアルデータ301および質問応答コレクションデータ302を用いる教師なし学習によって、マニュアルデータ301に対応する特定自然言語の分散表現を学習する。
【0048】
実施の形態においては、情報処理装置120とサーバ装置200とがネットワークNWを介して接続され、サーバ装置200に推論部202、変換部203、および学習部204が形成されているシステムについて説明した。推論部、変換部、および学習部は、情報処理装置120に形成されていてもよい。
【0049】
図9は、実施の形態の変形例に係るLC分析システム100Aの構成を示すブロック図である。LC分析システム100Aの構成は、
図1の情報処理装置120が120Aに置き換えられているとともに、データベース300が情報処理装置120Aに接続されている点である。これら以外は同様であるため、説明を繰り返さない。
【0050】
図9に示されるように、情報処理装置120Aは、推論部202A、変換部203A、および学習部204Aを含む。情報処理装置120Aにおいては、入出力部130がユーザRs1の質問の入力を受け付ける。推論部202A、変換部203A、および学習部204Aは、
図1の推論部202、変換部203、および学習部204のそれぞれと同様の機能を有するため、当該機能の説明を繰り返さない。
【0051】
図10は、
図9の情報処理装置120Aのハードウェア構成を示すブロック図である。情報処理装置120Aのハードウェア構成は、
図2のハードディスク123に
図7の機械学習プログラム53、学習データ54、応答推論モデル44、および変換モデル45が加えられているとともに、LC分析アプリケーションプログラム42が42Aに置き換えられた構成である。これら以外は同様であるため、説明を繰り返さない。
【0052】
図10に示されるように、LC分析アプリケーションプログラム42Aを実行するプロセッサ121は、推論部202Aとして機能する。機械学習プログラム53を実行するプロセッサ121は、変換部203Aおよび学習部204Aとして機能する。
【0053】
以上、実施の形態に係るシステムおよび方法、ならびに変形例に係る装置によれば、分析装置に関する質問に対して適切な応答を自動的に提供することができる。
【0054】
[態様]
上述した例示的な実施の形態は、以下の態様の具体例であることが当業者により理解される。
【0055】
(第1項)一態様に係る方法は、分析装置に関する質問に対する応答を生成する。方法は、コンピュータにより質問の入力を受け付けるステップと、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論するステップと、応答を出力するステップとを含む。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。
【0056】
第1項に記載の方法によれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対する応答を自動的に提供することができる。
【0057】
(第2項)第1項に記載の方法は、特定自然言語の分散表現を生成可能であり、マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換する変換モデルを準備するステップと、分析装置に関する手順と当該手順に対応する質問応答データとが関連付けられた教師データを準備するステップと、教師データを用いて、教師データの手順を変換モデルの入力とし、教師データの質問応答データを変換モデルの出力の正解データとして、変換モデルについて教師あり学習を行うステップと、学習済みの変換モデルから出力される質問応答データに含まれる質問を応答推論モデルの入力とし、当該質問応答データに含まれる応答を応答推論モデルの出力の正解データとする教師あり学習を応答推論モデルに対して行うステップとをさらに含む。
【0058】
第2項に記載の方法によれば、変換モデルおよび応答推論モデルに対する教師あり学習により、応答推論モデルの推論精度を向上させることができる。
【0059】
(第3項)第2項に記載の方法において、変換モデルおよび応答推論モデルの各々は、特定自然言語の分散表現が事前学習された特定モデルを含む。変換モデルおよび応答推論モデルの各々に対する教師あり学習は、特定モデルに対するファインチューニングとして行われる。
【0060】
第3項に記載の方法によれば、特定モデルが事前学習されていることにより、変換モデルおよび応答推論モデルに対する機械学習に要するコストを低減することができるとともに、応答推論モデルの推論精度をさらに向上させることができる。
【0061】
(第4項)第3項に記載の方法は、特定モデルに対して、マニュアルデータと、分析装置に関する質問応答データとを用いる追加学習を行うステップをさらに含む。
【0062】
第4項に記載の方法によれば、特定モデルによって生成される分散表現にマニュアルデータと質問応答データとに含まれる特定自然言語の語彙の傾向を反映させることができるため、応答推論モデルの推論精度をさらに向上させることができる。
【0063】
(第5項)一態様に係るシステムは、分析装置に関する質問に対する応答を生成する。システムは、端末装置と、サーバ装置とを備える。端末装置は、質問の入力を受け付ける。サーバ装置は、端末装置から質問を受信し、応答を端末装置に送信する。サーバ装置は、推論部を含む。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。
【0064】
第5項に記載のシステムによれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対応する応答を自動的に提供することができる。
【0065】
(第6項)一態様に係る装置は、分析装置に関する質問に対する応答を生成する。装置は、入出力部と、推論部とを備える。入出力部は、質問の入力を受け付ける。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論し、応答を入出力部に出力する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。
【0066】
第6項に記載の装置によれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対応する応答を自動的に提供することができる。
【0067】
なお、上述した実施の形態および変形例について、明細書内で言及されていない組み合わせを含めて、不都合または矛盾が生じない範囲内で、実施の形態で説明された構成を適宜組み合わせることは出願当初から予定されている。
【0068】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0069】
10 制御部、11 溶離液槽、12 液ポンプ、13 オートサンプラ、14 サンプルラック、15 バイアル瓶、16 カラムオーブン、17 カラム、18 検出器、19 コレクタ、42,42A 分析アプリケーションプログラム、44 応答推論モデル、45 変換モデル、52 分析装置管理プログラム、53 機械学習プログラム、54 学習データ、100,100A LC分析システム、110 液体クロマトグラフ、120,120A 情報処理装置、121,210 プロセッサ、122,220 メモリ、123,230 ハードディスク、124,240 通信インターフェース、125,260 バス、130,250 入出力部、131 ディスプレイ、132 マウス、133 キーボード、134 スピーカフォン、200 サーバ装置、201 通信部、202,202A 推論部、203,203A 変換部、204,204A 学習部、300 データベース、301 マニュアルデータ、302 質問応答コレクションデータ、400 分析装置管理サーバ、1000 分析装置管理システム、1341 マイク、1342 スピーカ、A1,A2 応答、Ac1,Uc1 キャラクタ、NW ネットワーク、Q1,Q2 質問、Rs1 ユーザ、Sd1~Sd3 教師データ。