特許7501624 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社島津製作所の特許一覧

特許7501624分析装置に関する質問への応答を生成する方法、システム、および装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-06-10

(45)【発行日】2024-06-18

(54)【発明の名称】分析装置に関する質問への応答を生成する方法、システム、および装置

(51)【国際特許分類】

G06F 16/90 20190101AFI20240611BHJP

【ＦＩ】

G06F16/90 100

【請求項の数】 6

(21)【出願番号】P 2022530029

(86)(22)【出願日】2021-03-05

(86)【国際出願番号】 JP2021008585

(87)【国際公開番号】W WO2021250954

(87)【国際公開日】2021-12-16

【審査請求日】2022-12-06

(31)【優先権主張番号】P 2020101522

(32)【優先日】2020-06-11

(33)【優先権主張国・地域又は機関】JP

(73)【特許権者】

【識別番号】000001993

【氏名又は名称】株式会社島津製作所

(74)【代理人】

【識別番号】110001195

【氏名又は名称】弁理士法人深見特許事務所

(72)【発明者】

【氏名】森本健太郎

【審査官】鹿野博嗣

(56)【参考文献】

【文献】特開２００６－０７２７８７（ＪＰ，Ａ）

【文献】特開２０１９－１９１８２７（ＪＰ，Ａ）

【文献】社内ヘルプデスクからカスタマーセンターまで！ＡＩＦＡＱ支援サービスＫｎｏｗｌｅｄｇｅＤｉｓｃｏｖｅｒｙ，シーテック２０１９，日本，2019年10月15日

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

(57)【特許請求の範囲】

【請求項1】

分析装置に関する質問に対する応答を生成する方法であって、
コンピュータにより前記質問の入力を受け付けるステップと、
前記分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、前記質問から前記応答を推論するステップと、
前記応答を出力するステップと、
前記マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換するステップと、
変換された前記質問応答データに含まれる質問を前記応答推論モデルの入力とし、当該質問応答データに含まれる応答を前記応答推論モデルの出力の正解データとする教師あり学習によって学習済みの前記応答推論モデルを生成するステップとを含む、方法。

【請求項2】

前記特定自然言語の分散表現を生成可能であり、前記質問応答データに変換する変換モデルを準備するステップを含み、前記変換モデルは、前記マニュアルデータに含まれる手順を前記質問応答データに変換し、前記方法はさらに、
前記分析装置に関する手順と当該手順に対応する質問応答データとが関連付けられた教師データを準備するステップと、
前記教師データを用いて、前記教師データの手順を前記変換モデルの入力とし、前記教師データの質問応答データを前記変換モデルの出力の正解データとして、前記変換モデルについて教師あり学習を行うステップとを含み、
学習済みの前記応答推論モデルを生成するステップは、学習済みの前記変換モデルから出力される質問応答データに含まれる質問を前記応答推論モデルの入力とする、請求項１に記載の方法。

【請求項3】

前記変換モデルおよび前記応答推論モデルの各々は、前記特定自然言語の分散表現が事前学習された特定モデルを含み、
前記変換モデルおよび前記応答推論モデルの各々に対する教師あり学習は、前記特定モデルに対するファインチューニングとして行われる、請求項２に記載の方法。

【請求項4】

前記特定モデルに対して、前記マニュアルデータと、前記分析装置に関する質問応答データとを用いる追加学習を行うステップをさらに含む、請求項３に記載の方法。

【請求項5】

分析装置に関する質問に対する応答を生成するシステムであって、
前記質問の入力を受け付ける端末装置と、
前記端末装置から前記質問を受信し、前記応答を前記端末装置に送信するサーバ装置とを備え、
前記サーバ装置は、前記分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、前記質問から前記応答を推論する推論部と、
前記マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換する変換部と、
変換された前記質問応答データに含まれる質問を前記応答推論モデルの入力とし、当該質問応答データに含まれる応答を前記応答推論モデルの出力の正解データとする教師あり学習によって学習済みの前記応答推論モデルを生成する学習部とを含む、システム。

【請求項6】

分析装置に関する質問に対する応答を生成する装置であって、
前記質問の入力を受け付ける入出力部と、
前記分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、前記質問から前記応答を推論し、前記応答を前記入出力部に出力する推論部と、
前記マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換する変換部と、
変換された前記質問応答データに含まれる質問を前記応答推論モデルの入力とし、当該質問応答データに含まれる応答を前記応答推論モデルの出力の正解データとする教師あり学習によって学習済みの前記応答推論モデルを生成する学習部とを含む、装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、分析装置に関する質問への応答を生成する方法、システム、および装置に関する。

【背景技術】

【0002】

従来、装置のマニュアルからユーザが必要とする当該装置に関する情報を検索する構成が知られている。たとえば、特開２０１９－１２５２２０号公報（特許文献１）には、検索端末から入力された検索ワードを用いて、電話機のマニュアルデータから当該電話機の設定を検索するマニュアル検索システムが開示されている。当該マニュアル検索システムによれば、複数の電話機による各設定の関連性が学習されて当該設定のスコア値が計算されることにより、一連の設定が検索される場合の検索回数を減らすことができ、ユーザの検索に要する時間および手間を短縮することができる。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１９－１２５２２０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

分析装置による精密な分析を実現するには、多くの手順を要する場合が多い。そのため、分析装置のマニュアルデータには膨大な情報が含まれ得る。一方で、マニュアルデータに含まれる手順は一般的な状況における手順であることが多いため、必ずしもユーザが解決を望む状況に関する情報がマニュアルデータに集約されているとは限らない。

【0005】

分析装置のマニュアルデータからユーザが所望の情報を見つけられない場合に、様々なユーザから実際に問い合わされた質問と当該質問に対する応答との組合せ（質問応答データ）がまとめられた質問応答コレクションデータ（たとえばＦＡＱ（Frequently Asked Questions））が参照される場合がある。しかし、或る質問に対して質問応答コレクションデータから取得される応答は断片的である場合が多いため、所望の情報を得るためには、ユーザはマニュアルデータおよび質問応答コレクションデータに対する検索を繰り返す必要がある。

【0006】

分析装置のマニュアルデータおよび質問応答コレクションデータに膨大な情報が含まれる場合、分析装置のマニュアルデータおよび質問応答コレクションデータの各々、ならびに分析装置のマニュアルデータおよび質問応答コレクションデータの間において表記ゆれ（同じ意味で使用されている用語の不一致）が生じ易い。そのため、ユーザは、様々な検索キーワードを用いて所望の情報を検索する必要が生じる。その結果、所望の情報を効率的に取得することが困難になり得る。

【0007】

本発明は、このような課題を解決するためになされたものであって、その目的は、分析装置に関する質問に対応する応答を自動的に提供することである。

【課題を解決するための手段】

【0008】

本発明の一局面に係る方法は、分析装置に関する質問に対する応答を生成する。方法は、コンピュータにより質問の入力を受け付けるステップと、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論するステップと、応答を出力するステップとを含む。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。

【0009】

本発明の他の局面に係るシステムは、分析装置に関する質問に対する応答を生成する。システムは、端末装置と、サーバ装置とを備える。端末装置は、質問の入力を受け付ける。サーバ装置は、端末装置から質問を受信し、応答を端末装置に送信する。サーバ装置は、推論部を含む。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。

【0010】

本発明の他の局面に係る装置は、分析装置に関する質問に対する応答を生成する。装置は、入出力部と、推論部とを備える。入出力部は、質問の入力を受け付ける。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論し、応答を入出力部に出力する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。

【発明の効果】

【0011】

本発明に係る方法、システム、および装置によれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対応する応答を自動的に提供することができる。

【図面の簡単な説明】

【0012】

【図1】実施の形態に係るシステムの一例である分析装置管理システムの構成を示すブロック図である。

【図2】図１の情報処理装置および入出力部のハードウェア構成を示すブロック図である。

【図3】図１の液体クロマトグラフの構成を示すブロック図である。

【図4】変換モデルに対するファインチューニングにおいて用いられる教師データの例を示す図である。

【図5】図１の学習部によって行われる学習処理の流れを示すフローチャートである。

【図6】推論部において行われる推論処理の流れを示すフローチャートである。

【図7】図１のサーバ装置のハードウェア構成を示すブロック図である。

【図8】図１のユーザの質問および当該質問に対応する応答がディスプレイに表示されている様子を示す図である。

【図9】実施の形態の変形例に係るＬＣ分析システムの構成を示すブロック図である。

【図10】図９の情報処理装置のハードウェア構成を示すブロック図である。

【発明を実施するための形態】

【0013】

以下に、実施の形態について図面を参照して詳細に説明する。なお、以下では図中の同一または相当部分には同一符号を付してその説明は原則的に繰返さない。

【0014】

図１は、実施の形態に係るシステムの一例である分析装置管理システム１０００の構成を示すブロック図である。図１に示されるように、分析装置管理システム１０００は、液体クロマトグラフ（ＬＣ：Liquid Chromatograph）分析システム１００と、分析装置管理サーバ４００とを含む。ＬＣ分析システム１００は、液体クロマトグラフ１１０（分析装置）と、情報処理装置１２０（端末装置）と、入出力部１３０とを含む。分析装置管理サーバ４００は、サーバ装置２００と、データベース３００とを含む。

【0015】

情報処理装置１２０は、パーソナルコンピュータまたはワークステーションを含む。情報処理装置１２０は、ネットワークＮＷを介して、サーバ装置２００に接続されている。ネットワークＮＷは、たとえばインターネット、ＷＡＮ（Wan Area Network）、またはＬＡＮ（Lan Area Network）を含む。情報処理装置１２０は、液体クロマトグラフ１１０に接続されている。情報処理装置１２０には、液体クロマトグラフ１１０の制御およびサーバ装置２００との通信を行うＬＣ分析アプリケーションがインストールされている。ユーザＲｓ１は、ＬＣ分析アプリケーションを介して、液体クロマトグラフ１１０を操作する。なお、情報処理装置１２０に複数の液体クロマトグラフ１１０が接続されていてもよい。情報処理装置１２０に、液体クロマトグラフ以外の分析装置（たとえば質量分析装置）が接続されていてもよい。また、分析装置管理サーバ４００に複数の分析システムが接続されてもよい。分析装置管理サーバ４００によって管理される分析装置は、液体クロマトグラフに限定されず、たとえば質量分析装置であってもよい。

【0016】

データベース３００は、液体クロマトグラフ１１０のマニュアルデータ３０１と、液体クロマトグラフ１１０の質問応答コレクションデータ３０２とを含む。マニュアルデータ３０１は、液体クロマトグラフ１１０に関する手順を含む。当該手順は、液体クロマトグラフ１１０に関する順序付けられた複数の操作を含む。質問応答コレクションデータ３０２には、液体クロマトグラフ１１０の様々なユーザから実際に問い合わされた内容がまとめられたＦＡＱが含まれる。ユーザＲｓ１は、ＬＣ分析アプリケーションを介して、マニュアルデータ３０１および質問応答コレクションデータ３０２を参照および検索することができる。なお、データベース３００は、サーバ装置２００内に形成されていてもよいし、ネットワークＮＷを介してサーバ装置２００に接続されていてもよい。

【0017】

図２は、図１の情報処理装置１２０および入出力部１３０のハードウェア構成を示すブロック図である。図２に示されるように、情報処理装置１２０は、プロセッサ１２１と、記憶部としてのメモリ１２２およびハードディスク１２３と、通信インターフェース１２４とを含む。これらは、バス１２５を介して相互に通信可能に接続されている。

【0018】

ハードディスク１２３は、不揮発性の記憶装置である。ハードディスク１２３には、たとえばオペレーティングシステム（ＯＳ：Operating System）のプログラム４１、およびＬＣ分析アプリケーションのプログラム４２が保存されている。図２に示されるデータ以外にも、ハードディスク１２３には、たとえば各種アプリケーションの設定および出力、ならびに検出器１８からの検出データが保存される。メモリ１２２は、揮発性の記憶装置であり、たとえばＤＲＡＭ（Dynamic Random Access Memory）を含む。

【0019】

プロセッサ１２１は、ＣＰＵ（Central Processing Unit）を含む。プロセッサ１２１は、ＧＰＵ（Graphics Processing Unit）をさらに含んでもよい。プロセッサ１２１は、ハードディスク１２３に保存されているプログラムをメモリ１２２に読み込んで実行する。プロセッサ１２１は、通信インターフェース１２４を介してネットワークＮＷに接続する。

【0020】

入出力部１３０は、ディスプレイ１３１と、マウス１３２と、キーボード１３３と、スピーカフォン１３４とを含む。スピーカフォン１３４は、マイク１３４１およびスピーカ１３４２を含む。ディスプレイ１３１、マウス１３２、キーボード１３３、およびスピーカフォン１３４の各々は、情報処理装置１２０に接続されている。ディスプレイ１３１には、ＬＣ分析アプリケーションのＧＵＩ（Graphical User Interface）が表示される。ユーザＲｓ１は、ディスプレイ１３１の表示を参照しながら、キーボード１３３の操作、マウス１３２の操作、またはスピーカフォン１３４への音声入力によって、ＬＣ分析アプリケーションへ所望の入力を行う。ＬＣ分析アプリケーションは、スピーカフォン１３４を介して音声を出力することができる。

【0021】

図３は、図１の液体クロマトグラフ１１０の構成を示すブロック図である。図３に示されるように、液体クロマトグラフ１１０は、制御部１０と、溶離液（移動相）槽１１と、送液ポンプ１２と、オートサンプラ１３と、カラムオーブン１６と、検出器１８と、コレクタ１９とを含む。オートサンプラ１３には、複数のバイアル瓶１５が搭載されたサンプルラック１４が設置されている。カラムオーブン１６内にはカラム１７が設置されている。情報処理装置１２０は、制御部１０を介して、送液ポンプ１２、オートサンプラ１３、カラムオーブン１６、および検出器１８の各々を制御し、液体クロマトグラフ１１０による分析作業の管理、および検出器１８において得られたデータの解析等を行う。

【0022】

送液ポンプ１２は、溶離液槽１１から溶離液を略一定流量で吸引し、オートサンプラ１３を介してカラム１７に流す。オートサンプラ１３においては、前処理が行われた後のバイアル瓶１５内の試料溶液が溶離液中に注入される。当該試料溶液は溶離液とともにカラム１７へと導入される。試料溶液中の複数の成分の各々がカラム１７を通過する時間（保持時間）が成分毎に異なるため、カラム１７を通過する間に試料溶液中の各成分は時間的に分離される。検出器１８は、カラム１７により分離されて溶出する成分を順次検出し、検出されたデータを制御部１０を介して情報処理装置１２０へ送信する。検出器１８から流出する溶離液はコレクタ１９に排出される。検出器１８から流出する溶離液は、他の分析装置（たとえば質量分析装置）に入力されてもよい。

【0023】

液体クロマトグラフ１１０による精密な分析を実現するには、多くの手順を要する場合が多い。そのため、液体クロマトグラフ１１０のマニュアルデータ３０１には膨大な情報が含まれる。一方で、マニュアルデータ３０１に含まれる手順は一般的な状況における手順であることが多いため、必ずしもユーザＲｓ１が解決を望む状況に関する情報がマニュアルデータ３０１に集約されているとは限らない。

【0024】

たとえば、液体クロマトグラフ１１０によって可能な分析方法として、試料溶液中のイオン種成分を分離して定量するイオンクロマトグラフィーを挙げることができる。イオンクロマトグラフィーは、環境水中の無機イオンの測定のために開発され、環境水または排水等の水質管理、大気環境測定、および食品分野などの品質管理等に適用可能な分析方法である。イオンクロマトグラフィーの分析対象となるイオンの種類が多種であることに加え、イオンクロマトグラフィーには前処理も必要となる。そのため、液体クロマトグラフ１１０のマニュアルデータ３０１を参照して液体クロマトグラフ１１０の操作を覚えただけでは、イオンクロマトグラフィーを液体クロマトグラフ１１０によって実施することができない。

【0025】

液体クロマトグラフ１１０のマニュアルデータ３０１からユーザＲｓ１が所望の情報を見つけられない場合に、質問応答コレクションデータ３０２が参照される場合がある。しかし、或る質問に対して質問応答コレクションデータ３０２から取得される応答は断片的である場合が多いため、所望の情報を得るためには、ユーザＲｓ１はマニュアルデータ３０１および質問応答コレクションデータ３０２に対する検索を繰り返す必要がある。

【0026】

マニュアルデータ３０１および質問応答コレクションデータ３０２に膨大な情報が含まれる場合、マニュアルデータ３０１および質問応答コレクションデータ３０２の各々、ならびに液体クロマトグラフ１１０のマニュアルデータ３０１および質問応答コレクションデータ３０２の間において表記ゆれが生じ易い。そのため、ユーザＲｓ１は、様々な検索キーワードを用いて所望の情報を検索する必要が生じる。その結果、所望の情報を効率的に取得することが困難になり得る。

【0027】

そこで、分析装置管理システム１０００においては、マニュアルデータ３０１および質問応答コレクションデータ３０２を用いる機械学習によって生成された学習済みの応答推論モデルを用いて、ユーザＲｓ１から入力される質問に対する適切な応答を推論する。分析装置管理システム１０００によれば、ユーザＲｓ１は、質問内容に関する表記ゆれを想定する必要がなく、ユーザＲｓ１にとって使いやすい用語によって作成された質問によって、所望の情報を含む応答を自動的に得ることができる。

【0028】

再び図１を参照して、ＬＣ分析アプリケーションは、液体クロマトグラフ１１０に関する質問に対する応答を生成する機能（質問応答機能）を有する。ディスプレイ１３１には、ＬＣ分析アプリケーションの質問応答機能に関するＧＵＩであるキャラクタＡｃ１およびＵｃ１が表示されている。キャラクタＡｃ１は、サーバ装置２００によって実現されるＡＩ（Artificial Intelligence）アシスタントに対応する。キャラクタＵｃ１は、ユーザＲｓ１に対応する。ユーザＲｓ１は、液体クロマトグラフ１１０に関する質問「カラムの取り付け方がわからない。」をスピーカフォン１３４に音声入力している。当該質問は、キーボード１３３から文字入力されてもよい。情報処理装置１２０は、当該質問の入力を受け付けてネットワークＮＷを介してサーバ装置２００に送信する。

【0029】

サーバ装置２００は、通信部２０１と、推論部２０２と、変換部２０３と、学習部２０４とを含む。推論部２０２は、応答推論モデル４４を用いて情報処理装置１２０から受信した質問から当該質問に対応する応答を推論し、当該応答を通信部２０１を介して情報処理装置１２０に送信する。変換部２０３は、変換モデル４５を用いてマニュアルデータ３０１に含まれる液体クロマトグラフ１１０に関する手順を、当該手順に対応する質問応答データに変換する。応答推論モデル４４および変換モデル４５は、予め準備されている。具体的には、応答推論モデル４４および変換モデル４５の各々は、マニュアルデータ３０１に対応する特定自然言語の分散表現（ベクトル表現）が事前学習された特定モデルを含み、ニューラルネットワークとして形成される。なお、マニュアルデータ３０１に対応する特定自然言語とは、マニュアルデータ３０１に含まれる情報を表現するのに使用されている自然言語である。特定モデルが事前学習されていることにより、応答推論モデル４４および変換モデル４５に対する機械学習に要するコストを低減することができるとともに、応答推論モデル４４の推論精度を向上させることができる。

【0030】

特定モデルの事前学習においては、特定自然言語の大量の文書データが体系化された言語資料であるコーパスが使用される。当該コーパスは、マニュアルデータ３０１および質問応答コレクションデータ３０２のような液体クロマトグラフに関する情報を含んでいなくてもよい。当該特定モデルとしては、たとえばＢＥＲＴ（Bidirectional Encoder Representations from Transformers）モデル、ＣＢＯＷ（Continuous Bag-of-Words）モデル、あるいはｓｋｉｐ－ｇｒａｍモデルを挙げることができる。

【0031】

応答推論モデル４４および変換モデル４５の各々は、特定モデルに対する追加学習およびファインチューニングによって生成された学習済みモデルである。特定モデルに対する追加学習により、特定モデルによって生成される分散表現にマニュアルデータおよび質問応答データに含まれる特定自然言語の語彙の傾向を反映させることができるため、応答推論モデル４４の推論精度をさらに向上させることができる。また、特定モデルに対するファインチューニングにより、応答推論モデル４４の推論精度をさらに向上させることができる。

【0032】

学習部２０４は、形態素解析を含む自然言語処理によって、応答推論モデル４４および変換モデル４５の各々に対して追加学習およびファインチューニングを行い、応答推論モデル４４および変換モデル４５の各々を学習済みモデルとする。学習部２０４は、自然言語処理において、学習部２０４は、追加学習において、マニュアルデータ３０１および質問応答コレクションデータ３０２を用いる教師なし学習を行う。なお、形態素解析とは、文書データを最小の言語単位（形態素あるいは単語）に分割する処理である。

【0033】

学習部２０４は、変換モデル４５に対するファインチューニングにおいて、マニュアルデータ３０１に含まれる手順と当該手順に対応する質問応答データとが関連付けられた教師データを用いて、当該教師データの手順を変換モデル４５の入力とし、当該教師データの質問応答データを変換モデル４５の出力の正解データとする教師あり学習を行う。当該教師データは、予め準備されている。当該教師データは、自動的に作成されてもよいし、手作業によって作成されてもよい。

【0034】

学習部２０４は、応答推論モデル４４に対するファインチューニングにおいて、変換部２０３から出力される質問応答データに含まれる質問を応答推論モデル４４の入力とし、当該質問応答データに含まれる応答を応答推論モデル４４の出力の正解データとする教師あり学習を行う。なお、応答推論モデル４４に対するファインチューニングにおいては、変換モデル４５からの出力に加えて、質問応答コレクションデータ３０２が用いられてもよい。また、当該ファインチューニングにおいては、変換モデル４５からの出力に替えて、質問応答コレクションデータ３０２が用いられてもよい。この場合、サーバ装置２００は、変換部２０３を含んでいなくてもよい。

【0035】

図４は、変換モデル４５に対するファインチューニングにおいて用いられる教師データの例を示す図である。図４には、教師データＳｄ１，Ｓｄ２，Ｓｄ３が示されている。教師データＳｄ１～Ｓｄ３の各々の液体クロマトグラフ１１０に関する手順は、マニュアルデータ３０１に含まれていてもよいし、含まれていなくてもよい。

【0036】

図４に示されるように、教師データＳｄ１には、液体クロマトグラフ１１０に関して、「カラムオーブンにカラムを取り付ける。」という手順が含まれる。当該手順においては、「１. 送液を停止する。」、「２. カラムオーブンのドアを開ける。」、「３. カラムの出口側を上に向けて、カラムクランプに取り付ける。」、および「４. カラムオーブンの扉を閉める。」という４つの操作がこの順に順序付けられている。教師データＳｄ１の手順に対応する正解データとしての質問応答データは、「どうやってカラムを取り付ければよいか。」という質問、および「送液を停止し、カラムオーブンのドアを開けて、カラムの出口側を上に向けてからカラムをカラムクランプに取り付ける。その後、カラムオーブンのドアを閉める。」という応答の組合せである。

【0037】

教師データＳｄ２には、液体クロマトグラフ１１０に関して、「試料びんを準備する。」という手順が含まれる。当該手順においては、「１. 移動相と組成が同等の溶媒で、試料を完全に溶解させる。」、「２. 試料をメンブランフィルタでろ過する。」、および「３. 試料びんまたはマイクロプレート、ディープウェルプレートのウェルに試料を充填する。」という３つの操作がこの順に順序付けられている。教師データＳｄ２の手順に対応する正解データとしての質問応答データは、「試料びんの準備はどうすればよいか。」という質問、および「移動相と組成が同等の溶媒で、試料を完全に溶解させる。試料をメンブランフィルタでろ過する。試料びんまたはマイクロプレート、ディープウェルプレートのウェルに試料を充填する。」という応答の組合せである。

【0038】

教師データＳｄ３には、液体クロマトグラフ１１０に関して、「試料をオートサンプラにセットする。」という手順が含まれる。当該手順においては、「１. サンプルラックを引き出す。」、「２. 試料が充填されたサンプルプレートをサンプルラックにセットする。」、「３. サンプルラックをガイドに沿って水平に奥まで差し込む。」という３つの操作がこの順に順序付けられている。教師データＳｄ３の手順に対応する正解データとしての質問応答データは、「試料をオートサンプラにセットする手順がわからない。」という質問、および「サンプルラックを引き出す。試料が充填されたサンプルプレートをサンプルラックにセットする。サンプルラックをガイドに沿って水平に奥まで差し込む。」という応答の組合せである。

【0039】

図５は、図１の学習部２０４によって行われる学習処理の流れを示すフローチャートである。以下ではステップを単にＳと記載する。

【0040】

図５に示されるように、学習部２０４は、Ｓ１０１において応答推論モデル４４および変換モデル４５に対して追加学習を行い、処理をＳ１０２に進める。学習部２０４は、Ｓ１０２において変換モデル４５に対してファインチューニングを行って処理をＳ１０３に進める。学習部２０４は、Ｓ１０３において変換モデル４５から出力される質問応答データを教師データとして応答推論モデルに対してファインチューニングを行い、学習処理を終了する。なお、Ｓ１０１の追加学習は必ずしも行われる必要はなく、学習処理がＳ１０２から開始されてもよい。

【0041】

図６は、推論部２０２において行われる推論処理の流れを示すフローチャートである。図６に示されるように、推論部２０２は、Ｓ２０１において情報処理装置１２０から質問を受信し、処理をＳ２０２に進める。推論部２０２は、Ｓ２０２において、応答推論モデル４４を用いて、情報処理装置１２０から受信した質問に対応する応答を推論し、処理をＳ２０３に進める。推論部２０２は、Ｓ２０３において、推論された応答を通信部２０１を介して情報処理装置１２０に送信し、処理を終了する。

【0042】

図７は、図１のサーバ装置２００のハードウェア構成を示すブロック図である。図７に示されるように、サーバ装置２００は、プロセッサ２１０と、記憶部としてのメモリ２２０およびハードディスク２３０と、通信部２０１としての通信インターフェース２４０と、入出力部２５０とを含む。これらは、バス２６０を介して相互に通信可能に接続されている。

【0043】

ハードディスク２３０は、不揮発性の記憶装置である。ハードディスク２３０には、たとえばオペレーティングシステム（ＯＳ：Operating System）のプログラム５１、分析装置管理プログラム５２、機械学習プログラム５３、機械学習用の学習データ５４、事前学習済みの応答推論モデル４４、および事前学習済みの変換モデル４５が保存されている。学習データ５４には、図４に示されるような教師データが含まれる。図７に示されるデータ以外にも、ハードディスク２３０には、たとえば各種アプリケーションの設定および出力が保存される。メモリ２２０は、揮発性の記憶装置であり、たとえばＤＲＡＭ（Dynamic Random Access Memory）を含む。

【0044】

プロセッサ２１０は、ＣＰＵ（Central Processing Unit）を含む。プロセッサ２１０は、ＧＰＵ（Graphics Processing Unit）をさらに含んでもよい。プロセッサ２１０は、ハードディスク２３０に保存されているプログラムをメモリ２２０に読み込んで実行し、サーバ装置２００の各種機能を実現する。たとえば、分析装置管理プログラム５２を実行するプロセッサ２１０は、推論部２０２として機能する。機械学習プログラム５３を実行するプロセッサ２１０は、変換部２０３および学習部２０４として機能する。プロセッサ２１０は、通信インターフェース２４０を介してネットワークＮＷに接続する。

【0045】

図８は、図１のユーザＲｓ１の質問および当該質問に対応する応答がディスプレイ１３１に表示されている様子を示す図である。図８に示されるように、ユーザＲｓ１に対応するキャラクタＵｃ１から「カラムの取り付け方がわからない。」という質問Ｑ１が発せられている。質問Ｑ１は、図１においてユーザＲｓ１がスピーカフォン１３４に音声入力した質問に対応する。ＡＩアシスタントに対応するキャラクタＡｃ１は、質問Ｑ１に対して、「送液を停止し、カラムオーブンのドアを開けて、カラムの出口側を上に向けてからカラムクランプにカラムを取り付けてください。その後、カラムオーブンのドアを閉めてください。」との応答Ａ１を発している。キャラクタＡｃ１から応答Ａ１が発せられた後、キャラクタＵｃ１から「オートサンプラにはどうやって試料をセットすればいいのだろう？」という質問Ｑ２が発せられている。キャラクタＡｃ１は、質問Ｑ２に対して、「サンプルラックを引き出して、試料が充填されたサンプルプレートをサンプルラックにセットしてください。その後、サンプルラックをガイドに沿って水平に奥まで差し込んでください。」との応答Ａ２を発している。

【0046】

質問Ｑ１は、図４の教師データＳｄ１の質問とは一致しないが、学習済みの応答推論モデル４４によって教師データＳｄ１の応答に類似する応答Ａ１が質問Ｑ１に対応する応答として推論されている。質問Ｑ２は、図４の教師データＳｄ３の質問とは一致しないが、学習済みの応答推論モデル４４によって教師データＳｄ３の応答に類似する応答Ａ２が質問Ｑ２に対応する応答として推論されている。

【0047】

実施の形態においては、応答推論モデル４４および変換モデル４５の各々が、マニュアルデータ３０１および質問応答コレクションデータ３０２を含まないコーパスを用いて事前学習された特定モデルを含む場合について説明した。応答推論モデル４４は、当該特定モデルを含んでいる必要はない。応答推論モデル４４が当該特定モデルを含んでいない場合、応答推論モデル４４および変換モデル４５は、マニュアルデータ３０１および質問応答コレクションデータ３０２を用いる教師なし学習によって、マニュアルデータ３０１に対応する特定自然言語の分散表現を学習する。

【0048】

実施の形態においては、情報処理装置１２０とサーバ装置２００とがネットワークＮＷを介して接続され、サーバ装置２００に推論部２０２、変換部２０３、および学習部２０４が形成されているシステムについて説明した。推論部、変換部、および学習部は、情報処理装置１２０に形成されていてもよい。

【0049】

図９は、実施の形態の変形例に係るＬＣ分析システム１００Ａの構成を示すブロック図である。ＬＣ分析システム１００Ａの構成は、図１の情報処理装置１２０が１２０Ａに置き換えられているとともに、データベース３００が情報処理装置１２０Ａに接続されている点である。これら以外は同様であるため、説明を繰り返さない。

【0050】

図９に示されるように、情報処理装置１２０Ａは、推論部２０２Ａ、変換部２０３Ａ、および学習部２０４Ａを含む。情報処理装置１２０Ａにおいては、入出力部１３０がユーザＲｓ１の質問の入力を受け付ける。推論部２０２Ａ、変換部２０３Ａ、および学習部２０４Ａは、図１の推論部２０２、変換部２０３、および学習部２０４のそれぞれと同様の機能を有するため、当該機能の説明を繰り返さない。

【0051】

図１０は、図９の情報処理装置１２０Ａのハードウェア構成を示すブロック図である。情報処理装置１２０Ａのハードウェア構成は、図２のハードディスク１２３に図７の機械学習プログラム５３、学習データ５４、応答推論モデル４４、および変換モデル４５が加えられているとともに、ＬＣ分析アプリケーションプログラム４２が４２Ａに置き換えられた構成である。これら以外は同様であるため、説明を繰り返さない。

【0052】

図１０に示されるように、ＬＣ分析アプリケーションプログラム４２Ａを実行するプロセッサ１２１は、推論部２０２Ａとして機能する。機械学習プログラム５３を実行するプロセッサ１２１は、変換部２０３Ａおよび学習部２０４Ａとして機能する。

【0053】

以上、実施の形態に係るシステムおよび方法、ならびに変形例に係る装置によれば、分析装置に関する質問に対して適切な応答を自動的に提供することができる。

【0054】

［態様］
上述した例示的な実施の形態は、以下の態様の具体例であることが当業者により理解される。

【0055】

（第１項）一態様に係る方法は、分析装置に関する質問に対する応答を生成する。方法は、コンピュータにより質問の入力を受け付けるステップと、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論するステップと、応答を出力するステップとを含む。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。

【0056】

第１項に記載の方法によれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対する応答を自動的に提供することができる。

【0057】

（第２項）第１項に記載の方法は、特定自然言語の分散表現を生成可能であり、マニュアルデータに含まれる手順を当該手順に対応する質問応答データに変換する変換モデルを準備するステップと、分析装置に関する手順と当該手順に対応する質問応答データとが関連付けられた教師データを準備するステップと、教師データを用いて、教師データの手順を変換モデルの入力とし、教師データの質問応答データを変換モデルの出力の正解データとして、変換モデルについて教師あり学習を行うステップと、学習済みの変換モデルから出力される質問応答データに含まれる質問を応答推論モデルの入力とし、当該質問応答データに含まれる応答を応答推論モデルの出力の正解データとする教師あり学習を応答推論モデルに対して行うステップとをさらに含む。

【0058】

第２項に記載の方法によれば、変換モデルおよび応答推論モデルに対する教師あり学習により、応答推論モデルの推論精度を向上させることができる。

【0059】

（第３項）第２項に記載の方法において、変換モデルおよび応答推論モデルの各々は、特定自然言語の分散表現が事前学習された特定モデルを含む。変換モデルおよび応答推論モデルの各々に対する教師あり学習は、特定モデルに対するファインチューニングとして行われる。

【0060】

第３項に記載の方法によれば、特定モデルが事前学習されていることにより、変換モデルおよび応答推論モデルに対する機械学習に要するコストを低減することができるとともに、応答推論モデルの推論精度をさらに向上させることができる。

【0061】

（第４項）第３項に記載の方法は、特定モデルに対して、マニュアルデータと、分析装置に関する質問応答データとを用いる追加学習を行うステップをさらに含む。

【0062】

第４項に記載の方法によれば、特定モデルによって生成される分散表現にマニュアルデータと質問応答データとに含まれる特定自然言語の語彙の傾向を反映させることができるため、応答推論モデルの推論精度をさらに向上させることができる。

【0063】

（第５項）一態様に係るシステムは、分析装置に関する質問に対する応答を生成する。システムは、端末装置と、サーバ装置とを備える。端末装置は、質問の入力を受け付ける。サーバ装置は、端末装置から質問を受信し、応答を端末装置に送信する。サーバ装置は、推論部を含む。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。

【0064】

第５項に記載のシステムによれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対応する応答を自動的に提供することができる。

【0065】

（第６項）一態様に係る装置は、分析装置に関する質問に対する応答を生成する。装置は、入出力部と、推論部とを備える。入出力部は、質問の入力を受け付ける。推論部は、分析装置に関する手順を含むマニュアルデータに対応する特定自然言語の分散表現を生成可能な学習済みの応答推論モデルを用いて、質問から応答を推論し、応答を入出力部に出力する。学習済みの応答推論モデルは、マニュアルデータと、分析装置に関する質問および応答と、の組合せである質問応答データを用いる機械学習によって生成される。

【0066】

第６項に記載の装置によれば、マニュアルデータおよび質問応答データを用いる機械学習によって生成される学習済みの応答推論モデルにより、分析装置に関する質問に対応する応答を自動的に提供することができる。

【0067】

なお、上述した実施の形態および変形例について、明細書内で言及されていない組み合わせを含めて、不都合または矛盾が生じない範囲内で、実施の形態で説明された構成を適宜組み合わせることは出願当初から予定されている。

【0068】

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0069】

１０制御部、１１溶離液槽、１２液ポンプ、１３オートサンプラ、１４サンプルラック、１５バイアル瓶、１６カラムオーブン、１７カラム、１８検出器、１９コレクタ、４２，４２Ａ分析アプリケーションプログラム、４４応答推論モデル、４５変換モデル、５２分析装置管理プログラム、５３機械学習プログラム、５４学習データ、１００，１００ＡＬＣ分析システム、１１０液体クロマトグラフ、１２０，１２０Ａ情報処理装置、１２１，２１０プロセッサ、１２２，２２０メモリ、１２３，２３０ハードディスク、１２４，２４０通信インターフェース、１２５，２６０バス、１３０，２５０入出力部、１３１ディスプレイ、１３２マウス、１３３キーボード、１３４スピーカフォン、２００サーバ装置、２０１通信部、２０２，２０２Ａ推論部、２０３，２０３Ａ変換部、２０４，２０４Ａ学習部、３００データベース、３０１マニュアルデータ、３０２質問応答コレクションデータ、４００分析装置管理サーバ、１０００分析装置管理システム、１３４１マイク、１３４２スピーカ、Ａ１，Ａ２応答、Ａｃ１，Ｕｃ１キャラクタ、ＮＷネットワーク、Ｑ１，Ｑ２質問、Ｒｓ１ユーザ、Ｓｄ１～Ｓｄ３教師データ。

【図1】