IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社dToshの特許一覧

特許7604050自動応答データ改善装置、方法及びプログラム
<>
  • 特許-自動応答データ改善装置、方法及びプログラム 図1
  • 特許-自動応答データ改善装置、方法及びプログラム 図2
  • 特許-自動応答データ改善装置、方法及びプログラム 図3
  • 特許-自動応答データ改善装置、方法及びプログラム 図4
  • 特許-自動応答データ改善装置、方法及びプログラム 図5
  • 特許-自動応答データ改善装置、方法及びプログラム 図6
  • 特許-自動応答データ改善装置、方法及びプログラム 図7
  • 特許-自動応答データ改善装置、方法及びプログラム 図8
  • 特許-自動応答データ改善装置、方法及びプログラム 図9
  • 特許-自動応答データ改善装置、方法及びプログラム 図10
  • 特許-自動応答データ改善装置、方法及びプログラム 図11
  • 特許-自動応答データ改善装置、方法及びプログラム 図12
  • 特許-自動応答データ改善装置、方法及びプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-12-13
(45)【発行日】2024-12-23
(54)【発明の名称】自動応答データ改善装置、方法及びプログラム
(51)【国際特許分類】
   G06F 16/90 20190101AFI20241216BHJP
   G06N 20/00 20190101ALI20241216BHJP
【FI】
G06F16/90 100
G06N20/00 130
【請求項の数】 10
(21)【出願番号】P 2024047030
(22)【出願日】2024-03-22
【審査請求日】2024-05-17
【早期審査対象出願】
(73)【特許権者】
【識別番号】521124685
【氏名又は名称】株式会社dTosh
(74)【代理人】
【識別番号】110000822
【氏名又は名称】弁理士法人グローバル知財
(72)【発明者】
【氏名】平尾 俊貴
(72)【発明者】
【氏名】森田 大夢
(72)【発明者】
【氏名】片山 寛基
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2024-006940(JP,A)
【文献】米国特許出願公開第2020/0372109(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
予め入力された学習データと生成AIを用いて、ユーザからの質問に対して自動応答する装置を改善する装置であって、
回答データに関するユーザ評価を受け付け、ユーザ評価データとしてデータベースに記憶させるユーザ評価手段と、
質問データ、前記回答データ及び前記ユーザ評価データを用いて自動回答の良否を評価した回答評価データを生成する回答評価手段と、
前記質問データ及び前記回答データに自然言語処理を行い、トピックモデリングを用いてカテゴリに分類し、データベースに記憶させるトピック推定手段と、
前記回答評価データ及び前記カテゴリを用いて、少なくともカテゴリ毎の前記自動回答の良否を解析する評価データ解析手段、
を備えることを特徴とする自動応答データ改善装置。
【請求項2】
前記評価データ解析手段は、入力が推奨される学習データを解析する学習データ解析手段を有することを特徴とする請求項1に記載の自動応答データ改善装置。
【請求項3】
前記評価データ解析手段は、入力が推奨される質問データを解析する質問データ解析手段を有することを特徴とする請求項1に記載の自動応答データ改善装置。
【請求項4】
ディスプレイ上に、所定期間中におけるカテゴリ毎の回答成功率と、前記回答成功率が所定の閾値を下回る質問内容のリスト、の少なくとも何れかが視覚的に表示される回答評価表示手段を更に備えることを特徴とする請求項1に記載の自動応答データ改善装置。
【請求項5】
シミュレーション用の学習データの入力を受け付けるシミュレーションデータ入力手段と、
前記回答成功率が所定の閾値を下回る質問内容をリストから選択する質問内容選択手段と、
シミュレーションデータの入力前後での、回答データに関する回答内容を並列的に表示するプレビュー手段、
を有するシミュレーション手段を更に備えることを特徴とする請求項4に記載の自動応答データ改善装置。
【請求項6】
前記トピック推定手段によるカテゴリ分類の修正を受け付けるトピック修正手段を更に備え、修正されたカテゴリ分類を前記質問データ及び前記回答データと紐付けしてデータベースに記憶させることを特徴とする請求項1に記載の自動応答データ改善装置。
【請求項7】
前記回答評価手段は、
前記質問データが有するユーザ情報及び質問日時に基づき、当該質問の直前又は直後の質問を抽出し、
前記質問データが有する質問内容と前記回答データが有する回答内容の少なくとも何れかに基づき、当該質問と、抽出された直前質問又は直後質問の関連性を判定する関連性判定手段を備え、
当該質問と関連性が肯定される直前質問又は直後質問の前記ユーザ評価データを、当該質問の回答評価に用いることを特徴とする請求項1に記載の自動応答データ改善装置。
【請求項8】
前記回答評価手段は、
質問データが有するユーザ情報、質問日時、質問内容、回答データ有する回答内容、の少なくとも何れかに基づき、質問群における複数の質問をグループとするグループ化手段を備え、
前記グループ中におけるユーザ評価データの種別、数、順序の少なくとも何れかに基づき、回答の評価を行うことを特徴とする請求項1に記載の自動応答データ改善装置。
【請求項9】
予め入力された学習データと生成AIを用いて、ユーザからの質問に対して自動応答する装置を改善する方法であって、
回答データに関するユーザ評価を受け付け、ユーザ評価データとしてデータベースに記憶させるユーザ評価ステップと、
質問データ、前記回答データ及び前記ユーザ評価データを用いて自動回答の良否を評価した回答評価データを生成する回答評価ステップと、
前記質問データ及び前記回答データに自然言語処理を行い、トピックモデリングを用いてカテゴリに分類し、データベースに記憶させるトピック推定ステップと、
前記回答評価データ及び前記カテゴリを用いて、少なくともカテゴリ毎の前記自動回答の良否を解析する評価データ解析ステップを、コンピュータが実行する自動応答データ改善方法。
【請求項10】
請求項9の自動応答データ改善方法の各ステップを、コンピュータに実行させる自動応答データ改善プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予め入力された学習データと生成AIを用いて、ユーザからの質問に対し自動応答する装置の回答精度を向上する技術に関するものである。
【背景技術】
【0002】
近年、ユーザからの質問などの入力に対して、プログラムにより自動で回答するシステムが普及している(例えば、特許文献1を参照。)。利用用途としては、当該企業に関する情報を顧客など、外部に伝えるために利用されることもあるが、企業等が、企業内部の取決めや、自らの提供する商品・サービスに関する情報を、組織内で共有するためにも利用されている。このような自動応答システムでは、回答精度の向上が望まれている。
【0003】
また、生成系AIを用いたサービスが急速に増加し、テキスト向けAIモデルとして、大規模言語モデル(LLM:Large Language Models)が急速な進歩を遂げている。大規模言語モデルとは、膨大なテキストデータとディープラーニング技術を用いて構築された自然言語処理のモデルのことである。
大規模言語モデルは、自動応答システムにも利用されており、企業等は、自己の保有する大量のテキストデータを大規模言語モデルに入力することで、自動応答システムを運用することが可能である。
【0004】
しかしながら、大規模言語モデルに入力されるデータは、人の手によって入力されるところ、どのようなデータをどの程度入力すればよいのかは事前には明らかではないため、必要なデータが入力されないことにより、十分な回答精度が得られないといった問題が存在した。
そのため現状では、自動応答システムの提供者が、ユーザに対して、入力に適した学習データについてコンサルティングを行っているのが実情である。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2016-99968号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
かかる状況に鑑みて、本発明は、ユーザに対して、入力に適した学習データの判断の基礎となる情報を効果的に提示でき、かつ利便性の高い自動応答データ改善装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決すべく、本発明の自動応答データ改善装置は、予め入力された学習データと生成AIを用いて、ユーザからの質問に対して自動応答する装置を改善する装置であって、回答データに関するユーザ評価を受け付け、ユーザ評価データとしてデータベースに記憶させるユーザ評価手段と、質問データ、回答データ及びユーザ評価データを用いて自動回答の良否を評価した回答評価データを生成する回答評価手段と、質問データ及び回答データに自然言語処理を行い、トピックモデリングを用いてカテゴリに分類し、データベースに記憶させるトピック推定手段と、回答評価データ及びカテゴリを用いて、少なくともカテゴリ毎の自動回答の良否を解析する評価データ解析手段、を備える。
ユーザによる評価を基に自動回答の良否を評価し、しかもカテゴリに分類して解析することにより、自動応答データの改善に有効な情報を効果的に解析できる。解析したデータは、ユーザが利用する端末のディスプレイ上に視覚的に表示してもよいし、音声などで出力してもよい。
ここでの自動応答データとは、質問データとこれに対する回答データの双方を含む意味で用いている。すなわち、自動応答装置の回答性能を向上させるだけではなく、ユーザによって入力される質問データの品質の向上も図る趣旨である。
ユーザ評価手段において受け付けるユーザ評価は、“Good”や“Bad”といった評価でもよいし、5段階評価などの段階的な評価でもよい。また、テキストでの自由な文章の入力を受け付けて、自然言語処理技術により当該文章を解析する構成でもよい。
トピック推定手段において用いられるトピックモデリングは1つに限られず、複数のトピックモデリングを用いて、各トピックモデリングのアルゴリズムの結果から、最適なトピックを自動で抽出することでもよい。
【0008】
本発明の自動応答データ改善装置を適用する自動応答装置は、予め入力された学習データと生成AIを用いて、ユーザからの質問に対して自動応答する装置を幅広く含み、RAG(Retrieval-Augmented Generation)技術が用いられた自動応答装置であることが好ましいが、例えば、ファインチューニングを行う構成でもよい。すなわち、予め入力された学習データとは、RAG技術が用いられた自動応答装置である場合は、自動応答装置に予め入力された学習データを意味することとなる。また、ファインチューニングを行う自動応答装置の場合は、予め入力された学習データとは、生成AIに再学習させた学習データを意味することとなる。学習データとしては、テキストや画像、音声など幅広いデータを入力できる。
生成AIとしては、“BERT”(Bidirectional Encoder Representations from Transformesrs)や、“GPT”(Generative Pre-trained Transformer)などの公知の大規模言語モデル(LLM)を活用した生成AIを幅広く利用できる。
【0009】
本発明の自動応答データ改善装置において、評価データ解析手段は、入力が推奨される学習データを解析する学習データ解析手段を有することでもよい。学習データ解析手段を有することにより、ユーザに対して、学習データとして入力することが好ましいデータを具体的に提示することが可能となる。
【0010】
本発明の自動応答データ改善装置において、評価データ解析手段は、入力が推奨される質問データを解析する質問データ解析手段を有することでもよい。質問データ解析手段を有することにより、質問データとして入力することが好ましいデータを具体的に提示することが可能となる。
【0011】
本発明の自動応答データ改善装置は、ディスプレイ上に、所定期間中におけるカテゴリ毎の回答成功率と、回答成功率が所定の閾値を下回る質問内容のリスト、の少なくとも何れかが視覚的に表示される回答評価表示手段を更に備えることが好ましい。所定期間中におけるカテゴリ毎の回答成功率が視覚的に表示されることにより、ユーザは、どのカテゴリに関する学習データを入力すればよいか等を一目で確認でき、利便性が向上する。また、過去と比較した回答成功率の変化や、質問数毎の回答成功率のグラフ等を表示してもよい。
回答成功率が所定の閾値を下回る質問内容のリストが視覚的に表示されることにより、ユーザは、具体的にどのような質問が、回答に失敗しやすい質問であるのかについて、容易に確認でき、利便性が向上する。
【0012】
本発明の自動応答データ改善装置は、シミュレーション用の学習データの入力を受け付けるシミュレーションデータ入力手段と、回答成功率が所定の閾値を下回る質問内容をリストから選択する質問内容選択手段と、シミュレーションデータの入力前後での、回答データに関する回答内容を並列的に表示するプレビュー手段、を有するシミュレーション手段を更に備えることが好ましい。シミュレーション手段を備えることにより、回答成功率が低い質問、言い換えれば回答に失敗しやすい質問について、適切な学習データを入力することで、回答性能が改善する効果を実感しやすくなる。これにより、自動応答データの改善に対するユーザのモチベーションを向上させることができる。
【0013】
本発明の自動応答データ改善装置は、トピック推定手段によるカテゴリ分類の修正を受け付けるトピック修正手段を更に備え、修正されたカテゴリ分類を質問データ及び回答データと紐付けしてデータベースに記憶させることが好ましい。トピック修正手段を備えることにより、ユーザは、トピック推定手段により推定されたカテゴリ分類を手動で修正することができる。また、修正されたカテゴリ分類に関するデータは、データベースに記憶されることにより、トピック推定手段の精度向上に用いることができる。
【0014】
本発明の自動応答データ改善装置において、回答評価手段は、質問データが有するユーザ情報及び質問日時に基づき、当該質問の直前又は直後の質問を抽出し、質問データが有する質問内容と回答データが有する回答内容の少なくとも何れかに基づき、当該質問と、抽出された直前質問又は直後質問の関連性を判定する関連性判定手段を備え、当該質問と関連性が肯定される直前質問又は直後質問のユーザ評価データを、当該質問の回答評価に用いることでもよい。一般に、同一のユーザによる時間的に近接した質問については、関連した質問であることが多い。そこで、当該質問の直前又は直後の質問に関するユーザ評価データを、当該質問の回答評価に用いることで、より精度の高い評価を可能としたものである。また、例えば、同一のユーザでなくとも、同一若しくは類似した部署や業務に携わるユーザによる質問について、直前又は直後の質問を抽出してもよい。質問データや回答データに基づく関連性の判定は、例えば自然言語処理を用いて抽出されたキーワードの類似度を参照することで行う。
【0015】
本発明の自動応答データ改善装置において、回答評価手段は、質問データが有するユーザ情報、質問日時、質問内容、回答データ有する回答内容、の少なくとも何れかに基づき、質問群における複数の質問をグループとするグループ化手段を備え、グループ中におけるユーザ評価データの種別、数、順序の少なくとも何れかに基づき、回答の評価を行うことでもよい。一般に、ユーザが質問を行う場合においては、十分な理解が得られるまで複数回にわたって質問が継続されることが存在する。そこで、当該質問の直前又は直後に限らず、複数の質問につき、同一のグループに属する質問であるとし、グループ中のユーザ評価データを利用することで、より精度の高い評価を可能としたものである。
グループ化に当たっては、ユーザ情報としては、ユーザの同一性や、部署や業務の同一性・類似性を考慮する。質問日時については日時の近接性、質問内容や回答内容については、自然言語処理を用いて抽出されたキーワードの類似度を参照する等により行う。グループを構成する質問の数は特に限定されない。また、グループ中におけるユーザ評価データの扱い方については、当該ユーザの評価傾向を参照してもよい。
【0016】
本発明の自動応答データ改善方法は、予め入力された学習データと生成AIを用いて、ユーザからの質問に対して自動応答する装置を改善する方法であって、回答データに関するユーザ評価を受け付け、ユーザ評価データとしてデータベースに記憶させるユーザ評価ステップと、質問データ、回答データ及びユーザ評価データを用いて自動回答の良否を評価した回答評価データを生成する回答評価ステップと、質問データ及び回答データに自然言語処理を行い、トピックモデリングを用いてカテゴリに分類し、データベースに記憶させるトピック推定ステップと、回答評価データ及びカテゴリを用いて、少なくともカテゴリ毎の自動回答の良否を解析する評価データ解析ステップを、コンピュータが実行する
【0017】
本発明の自動応答データ改善プログラムは、上記の自動応答データ改善方法の各ステップを、コンピュータに実行させるものである。
【発明の効果】
【0018】
本発明の自動応答データ改善装置、方法及びプログラムによれば、ユーザに対して、入力に適した学習データの判断の基礎となる情報を効果的に提示できるといった効果がある。また、利便性が高く、回答品質の向上に対するユーザのモチベーションを向上できるといった効果がある。
【図面の簡単な説明】
【0019】
図1】実施例1の自動応答データ改善装置の機能ブロック図
図2】自動応答システムのシステム構成図
図3】実施例1の自動応答データ改善方法の概略フロー図
図4】ユーザ評価イメージ図
図5】トピック推定手段の説明図
図6】学習データの改善イメージ図
図7】回答評価表示イメージ図
図8】推薦データの入力シミュレーションイメージ図
図9】実施例2の自動応答データ改善装置の機能ブロック図
図10】実施例2の回答評価手段の説明図
図11】実施例3の自動応答データ改善装置の機能ブロック図
図12】実施例3の回答評価手段の説明図
図13】グループ化された場合の評価手法の説明図
【発明を実施するための形態】
【0020】
以下、本発明の実施形態の一例を、図面を参照しながら詳細に説明していく。なお、本発明の範囲は、以下の実施例や図示例に限定されるものではなく、幾多の変更及び変形が可能である。
【実施例1】
【0021】
図1は、実施例1の自動応答データ改善装置の機能ブロック図を示している。図1に示すように、自動応答システム100は、自動応答データ改善装置1、自動応答装置2及び生成AI(LLM)3で構成される。
自動応答装置2は、予め入力された学習データ4aと生成AI3を用いて、ユーザ(図示せず)からの質問に対して自動応答する装置であり、データベース7を備える。生成AI3としては、“BERT”や、“GPT”などの公知の大規模言語モデル(LLM)を活用した生成AIを幅広く利用できる。
【0022】
自動応答装置2は、RAGと呼ばれる検索拡張生成技術が用いられている。RAG技術は、大規模言語モデルによる回答データの生成において、社内データなどの外部情報の検索を組み合わせることにより、回答精度を向上させる技術である。例えば、自動応答装置2がある企業内で用いられる場合、社内データを学習データ4aとして入力し、データベース7に保管する。データベース7に保管されるデータは、数値ベクトル(埋め込み)として保存するベクターデータベース構造で、効率良く検索できるように管理されている。ユーザが自動応答装置2に質問データ4bを入力すると、自動応答装置2は入力された質問データ4bと関連するデータ(word,pdf,pptx,excelなど)を自動検索し、入力された質問データ4bと自動検索された関連データをAPI通信で生成AI3に入力し、生成AI3が出力した回答結果を、自動応答装置2が備えるディスプレイ上に表示する。
【0023】
自動応答データ改善装置1は、自動応答装置2の回答精度を向上させるために、入力が推奨される学習データの手掛かりとなる情報を解析・提示する装置であり、ユーザ評価手段11、回答評価手段12、評価データ解析手段13、トピック推定手段14、回答評価表示手段15、シミュレーション手段16及びトピック修正手段17で構成される。
ユーザ評価手段11は、回答データ4cに関するユーザ評価を受け付け、ユーザ評価データとしてデータベース7に記憶させるものである。
回答評価手段12は、質問データ4b、回答データ4c及びユーザ評価データを用いて自動回答の良否を評価した回答評価データを生成するものである。
トピック推定手段14は、質問データ4b及び回答データ4cに自然言語処理を行い、トピックモデリングを用いてカテゴリに分類し、質問データ4b及び回答データ4cと紐付けしてデータベース7に記憶させるものである。トピック修正手段17は、トピック推定手段14によるカテゴリ分類の修正を受け付け、修正されたカテゴリ分類を質問データ4b及び回答データ4cと紐付けしてデータベース7に記憶させるものである。
評価データ解析手段13は、回答評価データ及びカテゴリを用いて、少なくともカテゴリ毎の自動回答の良否を解析するものであり、学習データ解析手段13a及び質問データ解析手段13bを備える。学習データ解析手段13aは、入力が推奨される学習データを解析する。また、質問データ解析手段13bは、入力が推奨される質問データを解析する。
【0024】
回答評価表示手段15は、ディスプレイ上に、所定期間中におけるカテゴリ毎の回答成功率と、回答成功率が所定の閾値を下回る質問内容のリスト、の少なくとも何れかが視覚的に表示されるものである。
シミュレーション手段16は、シミュレーションデータ入力手段161、質問内容選択手段162及びプレビュー手段163を備える。シミュレーションデータ入力手段161は、シミュレーション用の学習データ4aの入力を受け付ける。受け付けた学習データ4aは、自動応答装置2に送信される。質問内容選択手段162は、回答成功率が所定の閾値を下回る質問内容をリストから選択するものである。プレビュー手段163は、自動応答装置2から当該学習データ4aに対する回答データ4cを受け付け、シミュレーションデータの入力前後での、回答データ4cに関する回答内容を並列的に表示するものである。
【0025】
図2は、自動応答システムのシステム構成図を示している。図2に示すように、自動応答システム100は、サーバ(20,30)がPC51や、スマートフォン52、タブレット端末53などのクライアント端末とネットワーク6を介してデータの送受信を行うシステムである。サーバ20は自動応答装置2及び自動応答データ改善装置1として機能する。サーバ30は生成AI3として機能する。PC51などのクライアント端末を用いて、学習データ4aや質問データ4bの入力を行うことができる。また、自動応答データ改善装置1により提示される解析データや推薦データは、PC51などのクライアント端末に出力され、PC51のディスプレイ51aなどに表示される。解析・推薦データは、視覚的に提示されるだけではなく、音声などで聴覚的に提示されるものでもよい。なお、本実施例では、ユーザはPC51を用いて自動応答装置2及び自動応答データ改善装置1を利用するものとする。
【0026】
図3は、実施例1の自動応答データ改善方法の概略フロー図を示している。図3に示すように、まず、回答データ4cに関するユーザ評価を受け付け、ユーザ評価データとしてデータベース7に記憶させる(ステップS01:ユーザ評価ステップ)。
図4は、ユーザ評価イメージ図を示している。図4に示すように、ユーザによる質問41aに対して、生成AI3による回答42aが表示されている。そして、回答42aの下方には、“Good”の評価ボタン11aと“Bad”の評価ボタン11bが表示されている。ユーザは、質問41aに対する回答42aの内容を吟味した上で、良い回答であると感じた場合は、“Good”の評価ボタン11aをクリックし、悪い回答であると感じた場合は、“Bad”の評価ボタン11bをクリックして評価を行う。なお、ユーザ評価は必須ではなく、何れの評価ボタンもクリックされなかった場合は、ユーザ評価なしとして扱われる。入力されたユーザ評価データについては、質問データ4b及び回答データ4cと紐付けしてデータベース7に保存される。
【0027】
次に、図3に示すように、質問データ、回答データ及びユーザ評価データを用いて自動回答の良否を評価した回答評価データを生成する(ステップS02:回答評価ステップ)。自動回答の良否の評価は、回答評価手段12により行われる。本実施例での自動回答の良否の評価については、例えば、当該回答データに関するユーザ評価が“Good”である場合には、自動応答に成功したと評価して“+1”とし、ユーザ評価が“Bad”である場合には、自動応答に失敗したと評価して“-1”とする。また、ユーザ評価なしの場合は、成功又は失敗の何れでもないと評価して“0”とする。
【0028】
また、質問データ4b及び回答データ4cに自然言語処理を行い、トピックモデリングを用いてカテゴリに分類し、データベース7に記憶させる(ステップS03:トピック推定ステップ)。なお、ステップS02とステップS03の順序は問わない。
図5は、トピック推定手段の説明図を示している。図5に示すように、データベース7は、質問履歴データベース7a及び回答履歴データベース7bを備える。質問履歴データベース7aは、各質問について、質問ID、質問日時、質問内容、アカウントIDが保存されている。また、回答履歴データベース7bには、回答ID、回答内容、評価、関連する質問ID及びカテゴリが保存されている。質問IDが「q0000001」の質問を例にすると、当該質問は、質問履歴データベース7aに保存されており、また回答履歴データベース7bにおいても、関連する質問IDとして、「q0000001」が保存されている。
【0029】
トピック推定手段14は、質問ID「q0000001」の質問内容である「製品Xがよく売れる業界を教えてください。」と、その回答内容である「そのような情報はございませんので、回答できません。」とのテキストに対して自然言語処理を行う。具体的には、まず、各質問を単語に分割してベクトル化し、各単語の出現頻度など記録する(ベクトル変換)。その後、文章内であまり意味の持たない単語を除き、品詞の原型を統一するなどの処理を行う(データ前処理)。
ベクトル変換及びデータ前処理を行った後、トピック推定手段14は、トピックモデリング技術を用いて類似するカテゴリ群に各質問を分類する。なお、トピックモデリングのアルゴリズムは、1つのアルゴリズムだけで判定すると、そのアルゴリズムにバイアスがかかる可能性があるため、本実施例では、“Latent Seman+c Index(LSI)”、“Probabilis+c Latent Seman+c Indexing(PLSI)”、“Latent Dirichlet Alloca+on(LDA)”及び“コサイン類似度”の4つトピックモデリングのアルゴリズムの結果を見て、総合的に最適なトピックを自動で抽出する手法を採用している。
分類されたカテゴリに関するデータについては、質問データ4b及び回答データ4cと紐付けしてデータベース7に保存される。
【0030】
図6は、学習データの改善イメージ図であり、(1)はカテゴリ分類前、(2)はカテゴリ分類後、(3)は改善データ入力後を示している。図6(1)に示す質問群410中の質問(41b~41e)の内、質問(41b,41c)はユーザ評価が“Good”であり、自動応答に成功したと評価して“+1”とされたものである。これに対して、質問(41d,41e)はユーザ評価が“Bad”であり、自動応答に失敗したと評価して“-1”とされたものである。
図6(2)に示すように、図6(1)に示す質問群410中の質問(41b~41e)を、カテゴリ14aとカテゴリ14bに分類した結果、ここでは、カテゴリ14aに分類された質問(41b,41c)は評価が高いのに対して、カテゴリ14bに分類された質問(41b,41c)は評価が低く、改善の必要性が高いことが示唆されている。そこで、カテゴリ14bに関する学習データ4aの品質を高めることで、図6(3)に示すように、評価を向上させることができる。
【0031】
回答評価手段12による評価と、トピック推定手段14によるカテゴリ分類を用いて、カテゴリ毎の自動回答の良否を解析する(ステップS04:評価データ解析ステップ)。本実施例では、回答評価表示手段15を用いて、解析結果をディスプレイ51a上に視覚的に表示する。ここで、回答評価表示手段15を用いた視覚的表示の一例について説明する。図7は、回答評価表示イメージ図を示している。図7に示すように、ディスプレイ51a上には、画面左方に、回答評価結果(151a,151b)が表示され、画面右方に、カテゴリを分析した診断結果152が表示されている。なお、回答評価結果(151a,151b)は、上下にスクロールすることで、より多数の回答評価を順次閲覧することが可能である。
【0032】
回答評価結果(151a,151b)の上方には、ボタン(15a~15c)が配置され、ボタン(15a~15c)をクリックすることで、「カテゴリ名」毎や、「回答成功率」毎、又は「質問数」の多い順に表示するなど、回答評価結果の表示手法を切り替えることができる。図7に示す例では、ボタン15aがクリックされ、「カテゴリ名」毎の表示が選択されている。
回答評価結果(151a,151b)の内、ここでは回答評価結果151aを例に説明する。回答評価結果151aには、「カテゴリ1」として「経費精算」と表示され、「経費精算」のカテゴリに関する情報が表示されている。「経費精算」のカテゴリに関する情報としては、「遠隔地出張時の宿泊客について」などの質問データ中の質問内容や、「〇」又は「×」で表される質問に対する回答評価、円グラフ及び数値で表される「AI回答成功率」が表示されている。なお、括弧内の数値は、当該カテゴリに関する総質問件数を示している。
【0033】
カテゴリ1の「経費精算」や、カテゴリ2の「製品詳細」は、初期においてはトピック推定手段14が推定したカテゴリが表示されるが、「経費精算」又は「製品詳細」の右に設けられるボタン15dをクリックすることで、カテゴリ名を編集することが可能である。ボタン15dは、トピック修正手段17を機能させるものである。
回答評価結果(151a,151b)の下部に設けられるボタン15eは質問内容の表示数を増加させるものであり、カテゴリ1やカテゴリ2に関するより多くの質問を閲覧したい場合は、ボタン15eをクリックする。
回答評価結果151bの右下に設けられるボタン15fは条件の変更に用いるものであり、ボタン15fをクリックすることで、例えば、分析したい期間や、複数のカテゴリに所属する場合の表示の可否、といった条件で表示内容を絞り込むことができる。
【0034】
質問に対する評価は、ユーザ評価手段11により付与された“Good”又は“Bad”の評価について、回答評価手段12により、自動応答に成功したと評価して“+1”とされた評価を「〇」とし、又は自動応答に失敗したと評価して“-1”とされた評価を「×」として表示したものである。なお、図示しないが、ユーザ評価がなされず回答評価手段12による評価が“0”の場合は「△」と表示してもよい。
質問内容や質問に対する評価は、データベース7に蓄積されたものを出力しディスプレイ51a上に表示したものである。「AI回答成功率」は、ユーザの質問に対して、生成AI3が正しく回答できた回答率を示すものであり、データベース7に蓄積されたデータについて、評価データ解析手段13において解析され、回答評価表示手段15により画面表示される。図7に示すように、円グラフや%で「AI回答成功率」が視覚的に表示されることにより、ユーザの直感的な理解を促進し、利便性の高い情報提示が可能となっている。
【0035】
画面右方に表示される診断結果152は、カテゴリの分析結果を示すものであり、テキストで分かりやすく解説される。表示するテキストは、全文章につき評価データ解析手段13を用いて自動生成され、これによりバラエティに富んだ推薦が可能となっている。なお、かかる構成とは異なり、例えば、予め固定のフォーマット文を用意し、「製品詳細」などのカテゴリ名や、「“3”ヶ月間」、「“500”件」、「“50”%」などの数値に関しては分析結果を基に自動的に入力される構成としてもよい。
質問例152aは、回答に失敗したと評価された質問を抜粋したものである。質問例152aと解説文を併せて読むことで、診断結果とその改善方法に対する理解が促進される。ボタン15gをクリックすると、シミュレーション画面に遷移する。
【0036】
図8は、推薦データの入力シミュレーションイメージ図を示している。図8に示すように、ディスプレイ51a上には、画面左方に、データ追加部16a、データ一覧表示部16b、プルダウン16c及び質問(41f~41h)が表示され、画面右方に、プレビュー表示部16dが表示されている。なお、データ一覧表示部16b又は質問(41f~41h)は、上下にスクロールすることで、より多数のデータや質問を閲覧することが可能である。データ追加部16a、データ一覧表示部16b、プルダウン16c、質問(41f~41h)及びプレビュー表示部16dは、シミュレーション手段16を機能させるものである。
PC51を操作するユーザは、データ追加部16aにおいて、ファイルを選択し、又はドラッグアンドドロップで追加し、シミュレーション用の学習データ4aをサーバ20にアップロードする。アップロードされた学習データ4aは、データ一覧表示部16bに表示される。データ一覧表示部16bでは、詳細の確認やデータの削除等が可能である。
次に、プルダウン16cをクリックして、カテゴリを選択する。ここでは「製品詳細」のカテゴリが選択されている。選択されたカテゴリにおいて生成AI3が回答に失敗したと評価された質問のリストが表示される。ここでは質問(41f~41h)が表示されている。何れかの質問をクリックすると、プレビュー表示部16dにシミュレーション結果が表示される。図8では質問41fがクリックされている。
【0037】
プレビュー表示部16dには、質問を入力したユーザのアイコン・ID、質問41f、生成AI3による回答(42b、42c)、提案プロンプト表示部16e及びメッセージボックス16gが表示されている。質問41fに対して、アップロードされた学習データ4aをRAG技術で読み込んで回答した場合(after)の回答42cと、そのデータ無しで回答した場合(before)の回答42bが並べて表示されるため、データを投入する前と後で、どのように回答が変化するのかをリアルタイムで確認できる。Before時の回答42bは、データが無いため、RAG技術で回答できていないことが分かる。そして、2文目でもハルシネーションが起きていると考えられる。これに対して、After時の回答42cは、質問に対して正確に回答できていることが分かる。このように、シミュレーション手段16が設けられることにより、ユーザは、データ追加による改善結果を一目で確認することができ、改善による効果を実感できる。
【0038】
また、学習データの品質を向上させるだけではなく、質問の品質を向上させることも、回答精度を高めるうえで重要である。そこで、これまでのデータベース7に蓄積された、回答成功している質問の履歴をもとに、より良いプロンプトを自動生成し、提案プロンプト表示部16eに表示する。提案プロンプト表示部16eは、質問データ解析手段13bを機能させるものである。回答が成功しやすいプロンプトを自動推薦してくれるため、ユーザが共通で使用できるプロンプトリストへ登録すると、過去に当該質問で良い回答が得られなかったユーザも利用できるようになり、利便性が向上する。
提案プロンプト表示部16eに設けられた、「チャットへ入力」ボタン16fをクリックすると、当該プロンプトが自動的にメッセージボックスへ入力され、送信ボタン16hをクリックすることでプロンプトリストへ登録できる。これにより、具体的な情報をユーザが埋めるだけでよくなるという利点がある。
【実施例2】
【0039】
一般に、連続して質問がなされる場合には、関連性の高い質問がなされていることが多いとされる。そこで、本実施例では、同一ユーザによる時間的に近接した質問について、当該質問の評価に用いる構成について説明する。
図9は、実施例2の自動応答データ改善装置の機能ブロック図を示している。図9に示すように、実施例2の自動応答システム101は、自動応答データ改善装置1a、自動応答装置2及び生成AI(LLM)3で構成される。実施例2の自動応答データ改善装置1aは、実施例1の自動応答データ改善装置1と異なり、回答評価手段120が関連性判定手段12aを備える。その他の構成は実施例1と同様である。
関連性判定手段12aは、質問データ4bが有するユーザ情報及び質問日時に基づき、当該質問の直前又は直後の質問を抽出し、質問データ4bと回答データ4cの少なくとも何れかに基づき、当該質問と、抽出された直前質問又は直後質問の関連性を判定するものであり、当該質問と関連性が肯定される直前質問又は直後質問のユーザ評価データが、当該質問の回答評価に用いられる。
【0040】
図10は、実施例2の回答評価手段の説明図であり、(1)は実施例1の回答評価手段12、(2)は実施例2の回答評価手段120の各場合を示している。何れも同一ユーザにより、上から順に9つの質問がなされ、回答に対する各ユーザ評価データ(5a~5i)を“Good”、“Bad”又は“―”(評価無し)で図示している。図10(1)に示すように、実施例1の回答評価手段12は、ユーザ評価データ(5a~5i)を個別に判断する。したがって例えば、ユーザ評価データ5eについて、回答評価手段12を用いて評価する場合は、ユーザ評価データ5eのみを用いて評価を行う。
【0041】
これに対して、図10(2)に示すように、実施例2の回答評価手段120は、ユーザ評価データ(5a~5i)に対応する各質問の直前又は直後の質問を抽出して、関連性を判定する。したがって例えば、ユーザ評価データ5eについて、回答評価手段120を用いて評価する場合は、ユーザの同一性及び質問日時の近接性に基づき、ユーザ評価データ5eの直前のユーザ評価データ5dと、直後のユーザ評価データ5fを抽出した上で、関連性を判定する。関連性の判定は、質問データと回答データに基づき行われる。ここではユーザ評価データ5dとの関連性が肯定され、ユーザ評価データ5fとの関連性は否定されている。これに対して、ユーザ評価データ5hの場合は、直前のユーザ評価データ5gと、直後のユーザ評価データ5iの両方の関連性が肯定されている。ユーザ評価データ5eと関連性が肯定されたユーザ評価データ5dが、ユーザ評価データ5eに対応する質問データ及び回答データの評価に用いられる。また、ユーザ評価データ5hと関連性が肯定されたユーザ評価データ(5g,5i)が、ユーザ評価データ5hに対応する質問データ及び回答データの評価に用いられる。
このように、直前又は直後の質問に関する評価を用いることにより、より正確な評価が可能となり、有益な情報をユーザに提供することができる。
【実施例3】
【0042】
図11は、実施例3の自動応答データ改善装置の機能ブロック図を示している。図11に示すように、実施例3の自動応答システム102は、自動応答データ改善装置1b、自動応答装置2及び生成AI(LLM)3で構成される。実施例3の自動応答データ改善装置1bは、実施例1の自動応答データ改善装置1と異なり、回答評価手段121が関連性判定手段12bを備える。その他の構成は実施例1と同様である。
グループ化手段12bは、質問データが有するユーザ情報、質問日時、質問内容、回答データ有する回答内容、の少なくとも何れかに基づき、質問群における複数の質問をグループとするものであり、グループ中におけるユーザ評価データの種別、数、順序の少なくとも何れかに基づき、回答の評価を行う。
【0043】
図12は、実施例3の回答評価手段の説明図であり、(1)は実施例1の回答評価手段12、(2)は実施例3の回答評価手段121の各場合を示している。何れも同一ユーザにより、上から順に9つの質問がなされ、回答に対する各ユーザ評価データ(5a~5i)を“Good”、“Bad”又は“―”(評価無し)で図示している。図12(1)に示すように、実施例1の回答評価手段12は、ユーザ評価データ(5a~5i)を個別に判断する。
これに対して、図12(2)に示すように、実施例3の回答評価手段121は、ユーザ評価データ(5a~5i)に対応する質問をグループ化するものである。グループ化の基準としては、ユーザの同一性、質問日時の近接性、質問内容や回答内容の関連性を基準とする。図12(2)に示す例では、ユーザ評価データ(5a~5c)がグループ8a、ユーザ評価データ(5d,5e)がグループ8b、ユーザ評価データ(5f~5i)がグループ8cと判定されている。
グループ(8a~8c)について、それぞれユーザ評価データの種別や、数、順序に基づき、回答の評価を行う。ユーザ評価データの「種別」とは、“Good”、“Bad”又は“―”(評価無し)のことであり、「数」とは“Good”などの数のことである。また数だけではなく、割合も評価に加えてもよい。「順序」とは“Good”、“Bad”などの並び順のことである。
【0044】
図13は、グループ化された場合の評価手法の説明図であり、(1)は何れも最終的に“Good”のユーザ評価が得られた場合、(2)は何れも最終的に“Bad”のユーザ評価が得られた場合を示している。また、ここでは、全て3つの質問及び回答がグループと判定されている。
図13(1)に示すグループ8dのように、グループ中の評価が全て“Good”である場合は回答に成功したと評価できる。
グループ8eとグループ8fは何れも、“Good”が2つ、“Bad”が1つとなっているが、グループ8eでは1回目の質問で“Bad”と評価されたが、2回目の質問で“Good”と評価が好転している。そして、3回目の質問でも“Good”と評価されている。このことから1回目の質問では適切な回答が得られなかったが、2回目の質問では適切な回答が得られ、3回目の質問でより理解が深まったことが推察される。
これに対して、グループ8fでは、1回目の質問で“Good”と評価されたにもかかわらず、2回目の質問で“Bad”と評価されている。そして、3回目の質問では、“Good”と評価されている。1回目の質問では“Good”と評価されているが、直後の質問で“Bad”と評価されていることから、1回目の質問に対する評価が正確でなかった可能性が存在する。
以上のことから、グループ8fよりもグループ8eの方をより高い評価とすることができる。
【0045】
また、グループ8gとグループ8hを比較すると、グループ8gは、“Good”が1つ、“Bad”が2つ、グループ8hは、“Good”が1つ、“―”(評価無し)が2つとなっている。ここで、実施例1と同様に、評価無しの場合を「0」と評価することも可能であるが、一般に、複数の質問を行う際には、最後にしか評価を行わないユーザが多いといわれる。そして、例えば、所定期間における当該ユーザの評価の傾向から、“Good”又は“Bad”しかクリックしないことが判別できれば、“―”を最後に行った評価と逆の評価である可能性が高いと判定し、グループ8hの“―”を“Bad”と同様に扱い、グループ8gとグループ8hを同様の評価とすることも可能である。
なお、所定期間におけるユーザの評価の傾向からの、“Good”又は“Bad”しかクリックしないことの判別手法としては、例えば、ユーザの総質問数中における“Good”又は“Bad”の割合が所定の閾値を超えたことなどを基準として判別する。また、ユーザの評価の傾向としては、総質問数中における評価の回数、特定の評価種別の多寡などを判別してもよい。
【0046】
次に、図13(2)に示すグループ8iのように、グループ中の評価が全て“Bad”である場合は回答に失敗したと評価できる。
グループ8jとグループ8kは何れも、“Good”が1つ、“Bad”が2つとなっているが、グループ8jでは1回目の質問で“Good”と評価されたが、2回目の質問で“Bad”と評価され、そして、3回目の質問でも“Bad”と評価されている。
これに対して、グループ8kでは1回目の質問で“Bad”と評価されたが、2回目の質問で“Good”と評価が好転し、その後、3回目の質問では再度“Bad”と評価されている。
ここで例えば、最後に“Bad”評価が連続した場合には、回答に対する満足度が低いと評価できる。このことから、ループ8jよりもグループ8kの方をより高い評価とすることができる。
【0047】
また、グループ8lとグループ8mを比較すると、グループ8lは、“Good”が2つ、“Bad”が1つ、グループ8mは、“Bad”が1つ、“―”(評価無し)が2つとなっている。前述のグループ8gとグループ8hに対する評価と同様に、所定期間における当該ユーザの評価の傾向から、“Good”又は“Bad”しかクリックしないことが判別できれば、“―”を最後に行った評価と逆の評価である可能性が高いと判定し、グループ8mの“―”を“Good”と同様に扱い、グループ8lとグループ8mを同様の評価とすることが可能である。
しかしながら、一般に、評価無しが最初から連続して、最後に“Bad”評価がなされた場合は、何度質問をしても満足の得られる回答が得られなかった場合であることが多いといわれる。このことから、特段のユーザの評価傾向が判別されない場合は、グループ8m中の“―”は全て“Bad”と同等に評価すべきこととなる。
以上のことから、グループ8mよりもグループ8lの方をより高い評価とすることができる。
なお、ここで示した評価手法は、あくまでも一例に過ぎず、多様な評価基準を設定することで、より精度の高い評価を実現することが可能である。
【産業上の利用可能性】
【0048】
本発明は、生成AIを用いた自動応答装置において、回答精度を向上させる技術として有用である。
【符号の説明】
【0049】
1,1a,1b 自動応答データ改善装置
2 自動応答装置
3 生成AI
4a 学習データ
4b 質問データ
4c 回答データ
5a~5i ユーザ評価データ
6 ネットワーク
7 データベース
7a 質問履歴データベース
7b 回答履歴データベース
8a~8m グループ
11 ユーザ評価手段
11a,11b 評価ボタン
12,120,121 回答評価手段
12a 関連性判定手段
12b グループ化手段
13 評価データ解析手段
13a 学習データ解析手段
13b 質問データ解析手段
14 トピック推定手段
14a,14b カテゴリ
15 回答評価表示手段
15a~15g,16f ボタン
16 シミュレーション手段
16a データ追加部
16b データ一覧表示部
16c プルダウン
16d プレビュー表示部
16e 提案プロンプト表示部
16g メッセージボックス
16h 送信ボタン
17 トピック修正手段
20,30 サーバ
41a~41h 質問
42a~42c 回答
51 PC
51a ディスプレイ
52 スマートフォン
53 タブレット端末
100~102 自動応答システム
151a,151b 回答評価結果
152 診断結果
152a 質問例
161 シミュレーションデータ入力手段
162 質問内容選択手段
163 プレビュー手段
410 質問群
【要約】
【課題】ユーザに対して、入力に適した学習データの判断の基礎となる情報を効果的に提示でき、かつ利便性の高い自動応答データ改善装置、方法及びプログラムを提供する。
【解決手段】自動応答装置2の回答精度を向上させるために、入力が推奨される学習データの手掛かりとなる情報を解析・提示する装置であり、ユーザ評価手段11、回答評価手段12、評価データ解析手段13、トピック推定手段14、回答評価表示手段15、シミュレーション手段16及びトピック修正手段17で構成される。ユーザ評価手段11は、ユーザ評価を受け付ける。回答評価手段12は、自動回答の良否を評価した回答評価データを生成する。トピック推定手段14は、自然言語処理を行い、トピックモデリングを用いてカテゴリに分類する。評価データ解析手段13は、カテゴリ毎の自動回答の良否を解析する。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13