IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カラクリ株式会社の特許一覧

<>
  • 特開-プログラム、方法、およびシステム 図1
  • 特開-プログラム、方法、およびシステム 図2
  • 特開-プログラム、方法、およびシステム 図3
  • 特開-プログラム、方法、およびシステム 図4
  • 特開-プログラム、方法、およびシステム 図5
  • 特開-プログラム、方法、およびシステム 図6
  • 特開-プログラム、方法、およびシステム 図7
  • 特開-プログラム、方法、およびシステム 図8
  • 特開-プログラム、方法、およびシステム 図9
  • 特開-プログラム、方法、およびシステム 図10
  • 特開-プログラム、方法、およびシステム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024031110
(43)【公開日】2024-03-07
(54)【発明の名称】プログラム、方法、およびシステム
(51)【国際特許分類】
   G06F 16/90 20190101AFI20240229BHJP
【FI】
G06F16/90 100
【審査請求】有
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022134450
(22)【出願日】2022-08-25
(11)【特許番号】
(45)【特許公報発行日】2023-04-28
(71)【出願人】
【識別番号】518127510
【氏名又は名称】カラクリ株式会社
(74)【代理人】
【識別番号】110002815
【氏名又は名称】IPTech弁理士法人
(72)【発明者】
【氏名】武藤 健介
(72)【発明者】
【氏名】中嶋 恭久
(72)【発明者】
【氏名】吉田 雄紀
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175EA01
5B175HA02
(57)【要約】
【課題】効率的に機械学習モデルの識別性能を向上することができるシステムを提供する。
【解決手段】本開示のプログラムは、プロセッサに、ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップと、算出された第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定するステップと、選定されたカテゴリに紐づけられた回答パターンを、ユーザ端末に表示させるステップと、を実行させる。
【選択図】図8
【特許請求の範囲】
【請求項1】
プロセッサと、メモリとを備えるコンピュータに実行させるためのプログラムであって、前記プログラムは、前記プロセッサに、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、前記記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、前記質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップと、
算出された前記第1尤度、および前記ユーザの行動ログに基づいて、前記質問文が該当する前記カテゴリを選定するステップと、
選定された前記カテゴリに紐づけられた前記回答パターンを、前記ユーザ端末に対して出力するステップと、を実行させる、プログラム。
【請求項2】
前記第1尤度を算出するステップでは、
複数の前記質問パターンを入力データとし、複数の前記質問パターンそれぞれが該当する前記カテゴリを正解出力データとする学習用データを用いた機械学習により作成された質問分類モデルに対して、前記質問文を入力することで、複数の前記カテゴリそれぞれについて、前記第1尤度を算出する、請求項1に記載のプログラム。
【請求項3】
前記カテゴリを選定するステップでは、
前記質問分類モデルに対して変更を加えることなく、前記質問分類モデルから算出された前記第1尤度および前記行動ログに基づいて、前記カテゴリを選定する、請求項2に記載のプログラム。
【請求項4】
前記カテゴリを選定するステップでは、前記プロセッサに、
前記行動ログに基づいて、前記記憶部に記憶された複数の前記カテゴリそれぞれについて、前記行動ログから推定される前記行動ログとの関連の度合いを示す第2尤度を算出するステップと、
前記第1尤度および前記第2尤度に基づいて、前記質問文が該当する前記カテゴリを選定するステップと、を実行させる、請求項1に記載のプログラム。
【請求項5】
前記第2尤度を算出するステップでは、
複数のユーザの行動ログを入力データとし、前記行動ログそれぞれの後に行われた質問に対して適切な回答とされる前記カテゴリを正解出力データとする学習用データを用いた機械学習により作成された行動分類モデルに対して、前記行動ログを入力することで、複数の前記カテゴリそれぞれについて、前記第2尤度を算出する、請求項4に記載のプログラム。
【請求項6】
前記プロセッサに、
過去のユーザからの前記質問文の入力に関する一連の行動ログと、当該質問文に対して選定された前記カテゴリについての前記ユーザからの評価結果を用いて、前記一連の行動ログに対応して回答された前記カテゴリを、前記行動分類モデルへの前記学習用データとして選別するステップを実行させる、請求項5に記載のプログラム。
【請求項7】
前記第1尤度および前記第2尤度に基づいて、前記カテゴリを選定するステップでは、
前記第1尤度に対して前記第2尤度を乗じて得た評価指標に基づいて、前記カテゴリを選定する、請求項4から6のいずれか1項に記載のプログラム。
【請求項8】
前記カテゴリを選定するステップでは、
算出された前記第1尤度、および前記ユーザの行動ログに加えて、前記ユーザの属性に基づいて、前記カテゴリを選定する、請求項1に記載のプログラム。
【請求項9】
プロセッサと、メモリとを備えるコンピュータが実行するための方法であって、前記方法は、前記プロセッサが、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、前記記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、前記質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップと、
算出された前記第1尤度、および前記ユーザの行動ログに基づいて、前記質問文が該当する前記カテゴリを選定するステップと、
選定された前記カテゴリに紐づけられた前記回答パターンを、前記ユーザ端末に対して出力するステップと、を実行する、方法。
【請求項10】
プロセッサと、メモリとを備えるコンピュータにより実現されるシステムであって、前記システムは、前記プロセッサが、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、前記記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、前記質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出する手段と、
算出された前記第1尤度、および前記ユーザの行動ログに基づいて、前記質問文が該当する前記カテゴリを選定する手段と、
選定された前記カテゴリに紐づけられた前記回答パターンを、前記ユーザ端末に対して出力する手段と、を備える、システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、テキスト入力インタフェースによる応答システムとしての処理を実行させるプログラム、方法、およびシステムに関する。
【背景技術】
【0002】
従来、テキスト入力による問い合わせに対して自動で応答する自動応答システムが知られている。
例えば、特許文献1には、カテゴリ毎に複数用意された質問パターンを学習データとして機械学習された機械学習モデルを備えた自動応答システムが開示されている。
この自動応答システムでは、ユーザから入力された質問文が、機械学習モデルにより特定のカテゴリに分類され、分類されたカテゴリに対して紐づけられた回答パターンが、回答文としてユーザに対して出力される。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第6442807号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のシステムでは、長期間の運用により、例えば、分類対象となるカテゴリ数が増加することがあり、機械学習モデルが行う分類処理が高度となることで、継続して高い識別性能を維持することが難しかった。
【0005】
そこで本開示では、効率的に機械学習モデルの識別性能を向上することができるシステムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の一態様におけるプログラムは、プロセッサに、ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップと、算出された第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定するステップと、選定されたカテゴリに紐づけられた回答パターンを、ユーザ端末に表示させるステップと、を実行させる。
【発明の効果】
【0007】
本開示によれば、効率的に機械学習モデルの識別性能を向上することができる。
【図面の簡単な説明】
【0008】
図1】本発明の自動応答システムの概要を説明する図である。
図2】自動応答システムを構成する端末装置の機能的な構成を示す図である。
図3】自動応答システムを構成する質問回答サーバの機能的な構成を示す図である。
図4】記憶部が記憶するユーザデータベースの具体例を示す図である。
図5】記憶部が記憶する質問回答データベースの具体例を示す図である。
図6】記憶部が記憶する操作ログデータベースの具体例を示す図である。
図7】記憶部が記憶する学習用データデータベースの具体例を示す図である。
図8】自動応答システムによる処理のフローの全体を説明する図である。
図9】質問回答サーバによるカテゴリ選定の処理のフローを説明する図である。
図10】質問回答サーバによる学習用データの選定の処理のフローを説明する図である。
図11】変形例に係る自動応答システムの質問回答サーバの機能的な構成を示す図である。
【発明を実施するための形態】
【0009】
以下、本開示の実施形態に係る自動応答システム1について図面を参照しながら説明する。なお、以下に説明する実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態で説明される構成の全てが、本開示の必須構成要件であるとは限らない。また、実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。
【0010】
<1.概要>
図1は、本発明の自動応答システム1の概要を説明する図である。
図1に示すように、本実施形態に係る自動応答システム1は、質問パターンおよび回答パターンが記憶されたデータベースを用いて、対話形式のテキスト入力インタフェースによる応答システムとしての処理を実行するシステムである。
【0011】
特に自動応答システム1では、ユーザからの質問文に加えて、ユーザの行動ログを用いてユーザからの質問文に対して回答すべき内容(カテゴリおよび回答パターン)を選定する。ユーザの行動ログとは、具体的にはユーザの操作ログを指す。
例えば、類似する質問文による質問でも、質問の直前にユーザが行った操作(滞在しているサイト)の違いにより、ユーザが求めている回答が異なることが想定される。このため、自動応答システム1では、ユーザの操作ログを入力情報として利用することで、自動応答システム1の識別性能を向上することを目的としている。
以下の説明では、まず自動応答システム1の構成について説明した後に、自動応答システム1を用いた回答処理について詳述する。
【0012】
<2.全体構成>
本実施形態に係る自動応答システム1の全体構成について説明する。
図1に示すように、自動応答システム1は、複数の質問者(図1では、質問者が使用するユーザ端末10A、10B、以下総称して「ユーザ端末10」という)と、質問回答サーバ20と、を含む。複数のユーザ端末10と質問回答サーバ20とは、ネットワーク80を介して相互に通信可能に接続されている。ネットワーク80は、有線又は無線ネットワークにより構成される。
【0013】
ユーザ端末10は、質問者である各ユーザが操作する装置である。この他、ユーザ端末10は、例えば移動体通信システムに対応したタブレットや、スマートフォン等の携帯端末により実現される、ユーザ端末10は、据え置き型のPC(Personal Computer)、ラップトップPCなどであってもよい。
【0014】
ユーザ端末10は、ネットワーク80を介して質問回答サーバ20と通信可能に接続される。ユーザ端末10は、5G、LTE(Long Term Evolution)などの通信規格に対応した無線基地局81、IEEE(Institute of Electrical and Electronics Engineers)802.11などの無線LAN(Local Area Network)規格に対応した無線LANルータ82等の通信機器と通信することにより、ネットワーク80に接続される。
図1に示すように、ユーザ端末10は、通信IF(Interface)12と、入力装置13と、出力装置14と、メモリ15と、記憶部16と、プロセッサ19とを備える。
【0015】
通信IF12は、ユーザ端末10が外部の装置と通信するため、信号を入出力するためのインタフェースである。
入力装置13は、ユーザからの入力操作を受け付けるための装置(例えば、キーボードや、タッチパネル、タッチパッド、マウス等のポインティングデバイス等)である。
【0016】
出力装置14は、ユーザに対し情報を提示するための装置(ディスプレイ、スピーカ等)である。
メモリ15は、プログラム、および、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えばDRAM(Dynamic Random Access Memory)等の揮発性のメモリである。
【0017】
記憶部16は、データを保存するための記憶装置であり、例えばフラッシュメモリ、HDD(Hard Disc Drive)である。
プロセッサ19は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路などにより構成される。
【0018】
質問回答サーバ20は、質問者からの質問に対して、後述する質問回答データベース2022を参照して、回答を行う装置である。
質問回答サーバ20は、ネットワーク80に接続されたコンピュータである。質問回答サーバ20は、通信IF22と、入力装置23と、出力装置24と、プロセッサ25と、メモリ26と、ストレージ27とを備える。
【0019】
通信IF22は、質問回答サーバ20が外部の装置と通信するため、信号を入出力するためのインタフェースである。
入力装置23は、管理者からの入力操作を受け付けるための装置(例えば、キーボードや、タッチパネル、タッチパッド、マウス等のポインティングデバイス等)である。
出力装置24は、管理者に対し情報を提示するための装置(ディスプレイ、スピーカ等)である。
【0020】
プロセッサ25は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路などにより構成される。
メモリ26は、プログラム、および、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えばDRAM(Dynamic Random Access Memory)等の揮発性のメモリである。
ストレージ27は、データを保存するための記憶装置であり、例えばフラッシュメモリ、HDD(Hard Disc Drive)である。
【0021】
<3.ユーザ端末10の構成>
図2は、自動応答システム1を構成するユーザ端末10の機能的な構成を示すブロック図である。ユーザ端末10としては、例えば、ユーザサポートにおいて、不明な点の問合せを行おうとする一般ユーザが扱う端末が想定される。
【0022】
図2に示すように、ユーザ端末10は、複数のアンテナ(アンテナ111、アンテナ112)と、各アンテナに対応する無線通信部(第1無線通信部121、第2無線通信部122)と、入力受付部130(キーボード131およびディスプレイ132を含む)と、音声処理部140と、マイク141と、スピーカ142と、カメラ150と、記憶部160と、制御部170とを含む。
【0023】
ユーザ端末10は、図2では特に図示していない機能および構成(例えば、電力を保持するためのバッテリー、バッテリーから各回路への電力の供給を制御する電力供給回路など)も有している。図2に示すように、ユーザ端末10に含まれる各ブロックは、バス等により電気的に接続される。
【0024】
アンテナ111は、ユーザ端末10が発する信号を電波として放射する。また、アンテナ111は、空間から電波を受信して受信信号を第1無線通信部121へ与える。
【0025】
アンテナ112は、ユーザ端末10が発する信号を電波として放射する。また、アンテナ112は、空間から電波を受信して受信信号を第2無線通信部122へ与える。
【0026】
第1無線通信部121は、ユーザ端末10が他の無線機器と通信するため、アンテナ111を介して信号を送受信するための変復調処理などを行う。第2無線通信部122は、ユーザ端末10が他の無線機器と通信するため、アンテナ112を介して信号を送受信するための変復調処理などを行う。第1無線通信部121と第2無線通信部122とは、チューナー、RSSI(Received Signal Strength Indicator)算出回路、CRC(Cyclic Redundancy Check)算出回路、高周波回路などを含む通信モジュールである。第1無線通信部121と第2無線通信部122とは、ユーザ端末10が送受信する無線信号の変復調や周波数変換を行い、受信信号を制御部170へ与える。
【0027】
入力受付部130は、ユーザの入力操作を受け付けるための機構を有する。具体的には、入力受付部130は、キーボード131と、ディスプレイ132とを含む。なお、入力受付部130は、例えば静電容量方式のタッチパネルを用いることによって、タッチパネルに対するユーザの接触位置を検出する、タッチスクリーンとして構成してもよい。
【0028】
キーボード131は、ユーザ端末10のユーザの入力操作を受け付ける。キーボード131は、文字入力を行う装置であり、入力された文字情報を入力信号として制御部170へ出力する。
【0029】
ディスプレイ132は、制御部170の制御に応じて、画像、動画、テキストなどのデータを表示する。すなわち、ディスプレイ132は、ユーザに対して情報を出力する出力部としても機能する。ディスプレイ132は、例えばLCD(Liquid Crystal Display)や有機EL(Electro-Luminescence)ディスプレイによって実現される。
【0030】
音声処理部140は、音声信号の変復調を行う。音声処理部140は、マイク141から与えられる信号を変調して、変調後の信号を制御部170へ与える。また、音声処理部140は、音声信号をスピーカ142へ与える。
音声処理部140は、例えば音声処理用のプロセッサによって実現される。マイク141は、音声入力を受け付けて、当該音声入力に対応する音声信号を音声処理部140へ与える。スピーカ142は、音声処理部140から与えられる音声信号を音声に変換して当該音声をユーザ端末10の外部へ出力する。
【0031】
カメラ150は、受光素子により光を受光して、撮影画像として出力するためのデバイスである。カメラ150は、例えば、カメラ150から撮影対象までの距離を検出できる深度カメラである。
【0032】
記憶部160は、例えばフラッシュメモリ等により構成され、ユーザ端末10が使用するデータおよびプログラムを記憶する。ある局面において、記憶部160は、ユーザ情報161を記憶する。
【0033】
ユーザ情報161は、ユーザ端末10を使用して自動応答システム1を利用するユーザの情報である。ユーザ情報161としては、ユーザを識別する情報(ユーザID)、ユーザの名称、ユーザが所属している事業者の情報、ユーザが使用するメッセージアプリのアカウント情報、ユーザのメールアドレス等の連絡先に関する情報等が含まれる。
【0034】
制御部170は、記憶部160に記憶されるプログラムを読み込んで、プログラムに含まれる命令を実行することにより、ユーザ端末10の動作を制御する。制御部170は、例えば予めユーザ端末10にインストールされているアプリケーションプログラムである。制御部170は、プログラムに従って動作することにより、操作受付部171と、送受信部172と、データ処理部173と、表示処理部174としての機能を発揮する。
【0035】
操作受付部171は、キーボード131等の入力装置に対するユーザの入力操作を受け付ける処理を行う。
【0036】
送受信部172は、ユーザ端末10が、質問回答サーバ20等の外部の装置と、通信プロトコルに従ってデータを送受信するための処理を行う。
【0037】
データ処理部173は、ユーザ端末10が入力を受け付けたデータに対し、プログラムに従って演算を行い、演算結果をメモリ等に出力する処理を行う。
【0038】
表示処理部174は、ユーザに対し情報を提示する処理を行う。表示処理部174は、表示画像をディスプレイ132に表示させる処理、音声をスピーカ142に出力させる処理、振動をカメラ150に発生させる処理等を行う。
【0039】
<4.質問回答サーバ20の機能的な構成>
図3は、自動応答システム1を構成する質問回答サーバ20の機能的な構成を示す図である。質問回答サーバ20は、例えば、ユーザサポートにおいて、問合せ対応を行うサポート管理者が扱う端末が想定される。図3に示すように、質問回答サーバ20は、通信部201と、記憶部202と、制御部203としての機能を発揮する。
【0040】
通信部201は、質問回答サーバ20が外部の装置と通信するための処理を行う。
【0041】
記憶部202は、質問回答サーバ20が使用するデータおよびプログラムを記憶する。記憶部202は、例えば以下のデータを記憶している。
・ユーザデータベース2021(ユーザDB2021)
・質問回答データベース2022(質問回答DB2022)
・操作ログデータベース2023(操作ログDB2023)
・学習用データデータベース2024(学習用データDB2024)
・質問分類モデル2025
・行動分類モデル2026
【0042】
<4-1.データベースの構造>
各データベースについて詳述する。なお、質問分類モデル2025および行動分類モデル2026の詳細については後述する。
【0043】
<4-1―1.ユーザDB2021>
ユーザDB2021は、ユーザに関する情報を記憶するデータベースである。図4は、記憶部202が記憶するユーザDB2021の具体例を示す図である。
図4に示すように、ユーザDB2021は、項目「ユーザID」と、項目「氏名」と、項目「個人情報」と、項目「会員情報」と、項目「端末情報」と、を備えている。ユーザDB2021は、例えば、ユーザの会員登録の際に、新たなレコードが記録される。
【0044】
項目「ユーザID」には、個々のユーザを特定可能なユーザの識別情報が格納される。
【0045】
項目「氏名」は、ユーザIDに対応するユーザの氏名の情報が格納される。
【0046】
項目「個人情報」には、ユーザIDに対応するユーザの個人に関する属性情報が格納される。個人に関する属性情報としては、例えば、性別、年齢、居住地、国籍、職業、家族構成、出身地、母国語などを含む。
【0047】
項目「会員情報」には、ユーザIDに対応するユーザの自動応答システム1を利用する会員としての属性情報が格納される。会員としての属性情報としては、例えば、会員種別、利用履歴、契約内容などを含む。
【0048】
項目「端末情報」には、ユーザIDに対応するユーザが使用するユーザ端末10に関する属性情報が格納される。端末としての属性情報としては、タブレット、スマートフォンを識別する端末識別情報などが含まれる。
なお、図4に示すユーザDB2021の構造はあくまで例示であり、その他の項目を管理してもよい。また、記憶部202は、ユーザDB2021を記憶していなくてもよい。
【0049】
<4-1―2.質問回答DB2022>
図3に示す質問回答DB2022は、質問パターンと回答パターンとを対応付けて記憶するデータベースである。図5は、記憶部202が記憶する質問回答DB2022の具体例を示す図である。
図5に示すように、質問回答DB2022には、ある1つのカテゴリに対して、タイトルと1つの回答パターンが対応づけられ、1つのカテゴリに対して想定される1又は複数の質問パターンが記憶されている。すなわち、カテゴリに対して回答パターンおよび質問パターンが紐づけられている。質問回答DB2022は、例えば、自動応答システム1の運用開始前に予め記憶部202に記憶されている。
【0050】
質問回答DB2022は、項目「カテゴリ」と、項目「回答パターン」と、項目「質問パターン」と、を備えている。
項目「カテゴリ」には、質問のカテゴリを示すタイトルが格納される。カテゴリのタイトルとは、例えば、質問の内容を端的に示す情報である。
【0051】
また、1つの回答パターンに対する質問パターンは1つである必要はない。例えば、EC(Electronic Commerce)サイトで購入を行う場合に、ユーザが住所を変更する方法を知りたい場合には、「住所を変更したい。」「住所を間違えて入力しました。」などの様々な聞き方が考えられることから、一つのカテゴリ(タイトル:住所の変更方法)に対して、質問パターンを複数登録しておくことが有益である。
なお、質問回答DB2022は、カテゴリのタイトルを階層的に管理した構造を備えてもよい。
【0052】
<4-1―3.操作ログDB2023>
図3に示す操作ログDB2023は、ユーザの操作ログを記憶するデータベースである。図6は、記憶部202が記憶する操作ログDB2023の具体例を示す図である。
図6に示すように、操作ログDB2023は、項目「操作ログID」と、項目「ユーザID」と、項目「操作情報」と、項目「操作対象」と、項目「操作日時」と、を備えている。操作ログDB2023は、ユーザからの操作を受け付けるたびに、新たなレコードとして記録される。
【0053】
項目「操作ログID」には、質問回答サーバ20が取得したユーザの操作ログを識別するための識別情報が格納される。
【0054】
項目「ユーザID」には、操作ログIDに対応する操作を行ったユーザのユーザIDが格納される。
【0055】
項目「操作情報」には、操作ログIDに対応する操作情報が格納される。操作情報は、時系列情報であり、例えば、ログインをした操作、ページ遷移の操作、ページ滞在の操作、クリックによる商品選択の操作等が記述されている。
【0056】
項目「操作対象」には、操作ログIDに対応する操作を行ったサイトのURLが格納される。
【0057】
項目「操作日時」には、操作ログIDに対応する操作の日時が格納される。
なお、図6に示す操作ログDB2023の構造はあくまで例示であり、その他の項目を管理してもよい。
【0058】
<4-1―4.学習用データDB2024>
図3に示す学習用データDB2024は、ユーザの行動特性を学習するための学習用データを記憶するデータベースである。図7は、記憶部202が記憶する学習用データDB2024の具体例を示す図である。
図7に示すように、学習用データDB2024は、項目「データID」、項目「操作ログID」と、項目「回答カテゴリ」と、項目「評価スコア」と、を備えている。
【0059】
項目「データID」には、学習用データとしての識別情報が格納される。
【0060】
項目「操作ログID」には、データIDに対応する学習用データとして、過去のユーザからの問い合わせに関する一連の操作ログが格納される。問い合わせに関する一連の操作ログとは、自動応答システム1への質問文の入力およびその所定時間前に行った操作ログが含まれる。
【0061】
項目「回答カテゴリ」には、データIDに対応する問い合わせに関する一連の操作ログにおいて、自動応答システム1から回答された回答文が該当するカテゴリに関する情報が格納される。
【0062】
項目「評価スコア」には、データIDに対応する質問に関する一連の操作ログにおいて、自動応答システム1から回答された回答文に対して、ユーザがその後に入力したアンケート結果のスコアに関する情報が格納される。
なお、図7に示す学習用データDB2024の構造はあくまで例示であり、その他の項目を管理してもよい。
【0063】
<4-2.制御部の機能>
図3に示す制御部203は、質問回答サーバ20のプロセッサ29が、プログラムに従って処理を行うことにより、各種の機能モジュールとしての機能を発揮する。
各種の機能モジュールとしては、送受信制御モジュール2031、質問文取得モジュール2032、第1尤度算出モジュール2033、第2尤度算出モジュール2034、カテゴリ選定モジュール2035、回答出力モジュール2036、アンケート取得モジュール2037、および学習用データ選定モジュール2038を含む。
【0064】
送受信制御モジュール2031は、質問回答サーバ20が外部の装置から通信プロトコルに従って信号を送受信する処理を制御する。
【0065】
また、質問文取得モジュール2032は、ユーザがユーザ端末10に入力した質問に関するテキストデータを取得する。自然文のテキスト形式での質問を可能とすることにより、ユーザは人に問合せているのと同じような感覚で簡単に問合せを行うことが可能となる。
【0066】
第1尤度算出モジュール2033は、質問に関するテキストデータから、質問回答DB2022に記憶された複数のカテゴリそれぞれについて、第1尤度を算出する。第1尤度とは、質問文から推定される当該質問文との関連の度合いを示す指標である。言い換えれば、第1尤度とは、質問文から推定される、当該質問文が、あるカテゴリに該当する尤もらしさを示す指標である。
第1尤度算出モジュール2033は、質問分類モデル2025に対して、質問文を入力することで、複数のカテゴリそれぞれの第1尤度を算出する。
【0067】
質問分類モデル2025は、学習用データに基づき、モデル学習プログラムに従って機械学習モデルに機械学習を行わせることにより得られる。本実施形態において、質問分類モデル2025は、例えば、質問文の入力に対して、カテゴリ毎の第1尤度を出力するように学習されている。このとき、学習用データは、複数の質問パターンを入力データとし、複数の質問パターンそれぞれが該当するカテゴリを正解出力データとする。
【0068】
質問分類モデル2025は、例えば、複数の関数が合成されたパラメータ付き合成関数である。パラメータ付き合成関数は、複数の調整可能な関数、及びパラメータの組合せにより定義される。質問分類モデル2025は、上記の要請を満たす如何なるパラメータ付き合成関数であってもよいが、多層のネットワークモデル(以下、多層化ネットワークと呼ぶ)であるとする。多層化ネットワークを用いる質問分類モデル2025は、質問を入力する入力層と、第1尤度を出力する出力層と、入力層と出力層との間に設けられる少なくとも1層の中間層あるいは隠れ層とを有する。質問分類モデル2025は、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定される。
【0069】
本実施形態に係る多層化ネットワークとしては、例えば、深層学習(Deep Learning)の対象となる多層ニューラルネットワークである深層ニューラルネットワーク(Deep Neural Network:DNN)が用いられ得る。DNNとしては、例えば、時系列情報等を対象とする再帰型ニューラルネットワーク(Recurrent Neural Network:RNN)を用いてもよい。また、自然言語を対象とする自己注意機構付きネットワークを用いてもよい。
【0070】
第1尤度の算出において、質問分類モデル2025は、質問文を、質問回答DB2022に記憶された質問パターンと比較し、その類似度に基づいて、第1尤度を算出する。
類似度の算出では、例えば、自然言語処理により計算することが可能である。具体的には、質問パターンと質問文からキーワードをそれぞれ抽出しておき、キーワードの一致度をキーワード毎の重みなども用いて類似度とすることが考えられる。他にも、質問パターンと質問文をそれぞれベクトル化し、コサイン類似度を用いて類似度を算出することも可能である。このように、類似度を用いて質問文がどの質問パターン群に類似するか算出することで、質問回答DB2022に記憶されている質問パターンと同一でなくとも、回答パターンを選択することが可能となる。
【0071】
第2尤度算出モジュール2034は、行動ログ(操作ログ)に基づいて、質問回答DB2022に記憶された複数のカテゴリそれぞれについて、第2尤度を算出する。第2尤度とは、行動ログから推定される当該操作ログと、カテゴリと、の関連の度合を示す指標である。言い換えれば、第2尤度とは、ユーザの行動ログから推定される、当該行動ログをとるユーザからの質問が、あるカテゴリに該当する尤もらしさを示す指標である。
【0072】
第2尤度算出モジュール2034は、行動分類モデル2026に対して、行動ログを入力することで、複数のカテゴリそれぞれの第2尤度を算出する。行動ログとしては、操作ログDB2023に格納される各項目の少なくともいずれかの情報を用いることができる。例えば、質問文を入力した時点、又はその直前に開いているウェブサイトのページの情報を、行動ログとして用いることができる。質問文を入力した時点、又はその直前に開いているウェブサイトのページの情報は、操作ログDB2023における項目「操作対象」から取得することができる。
【0073】
行動分類モデル2026は、学習用データに基づき、モデル学習プログラムに従って機械学習モデルに機械学習を行わせることにより得られる。本実施形態において、行動分類モデル2026は、例えば、行動ログの入力に対して、カテゴリ毎の第2尤度を出力するように学習されている。このとき、学習用データは、複数のユーザの行動ログを入力データとし、行動ログそれぞれに対応するカテゴリを正解出力データとする。行動ログに対応するカテゴリとは、当該行動ログにおいて行われた質問に対して適切な回答とされるカテゴリを指す。
【0074】
行動分類モデル2026は、例えば、複数の関数が合成されたパラメータ付き合成関数である。パラメータ付き合成関数は、複数の調整可能な関数、及びパラメータの組合せにより定義される。行動分類モデル2026は、上記の要請を満たす如何なるパラメータ付き合成関数であってもよいが、多層のネットワークモデル(以下、多層化ネットワークと呼ぶ)であるとする。多層化ネットワークを用いる行動分類モデル2026は、操作ログを入力する入力層と、第2尤度を出力する出力層と、入力層と出力層との間に設けられる少なくとも1層の中間層あるいは隠れ層とを有する。行動分類モデル2026は、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定される。
【0075】
本実施形態に係る多層化ネットワークとしては、例えば、深層学習(Deep Learning)の対象となる多層ニューラルネットワークである深層ニューラルネットワーク(Deep Neural Network:DNN)が用いられ得る。DNNとしては、例えば、時系列情報等を対象とする再帰型ニューラルネットワーク(Recurrent Neural Network:RNN)を用いてもよい。また、自然言語を対象とする自己注意機構付きネットワークを用いてもよい。
【0076】
学習用データDB2024に記憶された操作ログを用いて行動分類モデル2026を作成することができる。この場合には、第2尤度の算出において、行動分類モデル2026は、入力されたユーザの行動ログ(操作ログ)を、学習用データDB2024に記憶された操作ログと比較し、その類似度に基づいて、第2尤度を算出する。
【0077】
また、第2尤度の算出では、行動分類モデル2026を、前述した第2尤度を出力する機械学習モデルとする手法の他に、行動分類モデル2026が、過去の回答結果の実績から、統計的に第2尤度を算出する手法を採用してもよい。
具体的には、例えば行動ログとして、質問文を入力した時点、又はその直前に開いているウェブサイトのページの情報を用いる場合には、行動分類モデル2026は、当該ページを開いているユーザが過去に行った質問について、その後に回答されたそれぞれのカテゴリに関する確立分布を算出し、当該ウェブサイトのページに対応するカテゴリごとの第2尤度とすることができる。
【0078】
また、行動分類モデル2026は、学習用データDB2024に蓄積された学習用データを統計的に処理することで、第2尤度を算出する手法を採用してもよい。
この場合には、例えば行動ログとして、質問文を入力した時点、又はその直前に開いているウェブサイトのページの情報を用いる場合において、当該ページを開いているユーザが過去に行った質問のうち、回答後のアンケートで肯定的な評価を得られた割合について、回答されたそれぞれのカテゴリを変数とする確立分布を算出し、当該ウェブサイトのページに対応するカテゴリごとの第2尤度としてもよい。
【0079】
カテゴリ選定モジュール2035は、第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定する。すなわち、質問回答サーバ20は、質問文とは異なる性質の情報であるユーザの行動ログを用いて、回答するべきカテゴリを選定する。
【0080】
カテゴリ選定モジュール2035は、カテゴリを選定する際に、質問分類モデル2025に対して変更を加えることなく、質問分類モデル2025から算出された第1尤度および行動ログに基づいて、カテゴリを選定する。すなわち、カテゴリ選定モジュール2035は、質問文から推定される回答するべきカテゴリに関する評価と、ユーザの行動ログから推定される回答するべきカテゴリに関する評価と、を個別に行ったうえで、それぞれの評価結果を統合して、質問文に対して回答するべきカテゴリを最終的に選定する。この判断手法によれば、従来から採用されていた質問文から回答するべきカテゴリを推定する質問分類モデル2025を変更することなく、踏襲することができる。
【0081】
カテゴリ選定モジュール2035は、第1尤度および第2尤度に基づいて、質問文が該当するカテゴリを選定する。具体的には、カテゴリ選定モジュール2035は、第1尤度に対して第2尤度を乗じて評価指標を算出し、算出した評価指標に基づいて、カテゴリを選定する。なお、カテゴリ選定モジュール2035は、第1尤度の値と第2尤度の値とを乗じて得た値に対して、予め設定された任意の正規化を行って評価指標の値としてもよい。
カテゴリ選定モジュール2035は、評価指標の上位n件のカテゴリを選択してもよい。
【0082】
回答出力モジュール2036は、選定されたカテゴリに紐づけられた回答パターンを、ユーザ端末10に対して出力する。回答出力モジュール2036は、質問回答DB2022を参照して、カテゴリ選定モジュール2035が選定したカテゴリと紐づけられている回答パターンを特定し、回答パターンのテキストデータを、質問文に対する回答として、ユーザ端末10に対して出力する。
回答出力モジュール2036は、評価指標の上位n件の回答文を、カテゴリとともにユーザ端末10に出力し、ユーザに最も適切な回答を選択させてもよい。
【0083】
また、回答出力モジュール2036は、選定されたカテゴリの評価指標が、予め設定した閾値を超えない場合には、質問文の表現が不明確であると推定し、回答パターンの表示を行わないとともに、「質問文を変更してください」など、別の質問を促すような表示を行うことも可能である。これにより、ユーザは、質問文を訂正する機会が得られるとともに、意図した質問に対する回答とは異なる回答パターンが表示されることを避け、不要な混乱を招かずに済むことが可能となる。
【0084】
アンケート取得モジュール2037は、ユーザ端末10に対してアンケートを出力する。アンケートは、ユーザに対して出力した回答の妥当性の評価に関する内容となっている。アンケートには、例えば以下の質問が設定されている。
・ユーザが抱える課題が解決したどうか
・回答したカテゴリおよび回答が妥当であったかどうか
アンケートへの回答形式は、Yes/Noといった択一的な回答形式であってもよいし、5段階評価のような定量的な回答形式であってもよい。
【0085】
学習用データ選定モジュール2038は、行動分類モデル2026が機械学習をするための学習用データを選定する。学習用データ選定モジュール2038は、過去のユーザからの質問文の入力に関する一連の行動ログと、当該質問文に対して選定されたカテゴリについてのユーザからの評価結果を用いて、一連の行動ログに対応する回答カテゴリを学習用データとして選別する。
すなわち、学習用データ選定モジュール2038は、ユーザから高評価を得た回答が紐づけられたカテゴリと、その時の質問に至った一連の行動ログと、を学習用データとして選別して、学習用データDB2024に記憶させる。
【0086】
<5.処理の流れ>
次に、自動応答システム1の処理について説明する。自動応答システム1は、対話形式のテキスト入力インタフェースによる応答システムとしての処理を実行する。すなわち、自動応答システム1は、対話形式のテキスト入力インタフェースを用いて、ユーザサポートの問い合わせ画面におけるチャットボットとしての役割を担う。
【0087】
対話形式のテキスト入力インタフェースによる応答システムとしては、例えばECサイトの問い合わせ画面の右下等にポップアップ表示されるチャットボットが挙げられる。
対話形式のテキスト入力インタフェースによる応答システムでは、まず、システム設定の準備として、対話形式のテキスト入力インタフェースによる応答システムとして使用する会話カードの登録を行う。会話カードには、ユーザに対して質問のテキスト入力を促すための案内文が含まれる。これにより、問い合わせ画面にアクセスしたユーザに対して、メッセージによる案内を行う準備が整った状態となる。
【0088】
図8は、自動応答システム1による処理のフローの全体を説明する図である。
図8に示すように、自動応答システム1の処理では、まず、ユーザがユーザ端末10のキーボード131から、質問内容をテキスト入力する(ステップS101)。ユーザ端末10の制御部170は、入力されたテキスト情報をデータ処理部173の処理に従って、送受信部172を介して質問回答サーバ20に送信する。
【0089】
ステップS101の後に、質問回答サーバ20は、質問文を取得する(ステップS201)。
具体的には、質問回答サーバ20の質問文取得モジュール2032が、ユーザ端末10から送信された質問に関するテキスト情報を取得する。
【0090】
ステップS201の後に、質問回答サーバ20は、それぞれのカテゴリにおける第1尤度を算出する(ステップS202)。
具体的には、質問回答サーバ20の第1尤度算出モジュール2033は、質問に関するテキスト情報を質問分類モデル2025に入力することで、質問回答DB2022に記憶された複数のカテゴリについて、それぞれにおける第1尤度を算出する。
【0091】
ステップS202の後に、質問回答サーバ20は、カテゴリを選定する(ステップS203)。図9は、質問回答サーバ20によるカテゴリ選定の処理のフローを説明する図である。
図9に示すように、カテゴリ選定の処理では、質問回答サーバ20は、それぞれのカテゴリにおける第2尤度を算出する(ステップS2031)。
具体的には、質問回答サーバ20の第2尤度算出モジュール2034は、行動分類モデル2026に対してユーザの行動ログを入力することで、第2尤度を算出する。
【0092】
ステップS2031の後に、質問回答サーバ20は、第1尤度と第2尤度とを用いて評価指標を算出する(ステップS2032)。
具体的には、質問回答サーバ20のカテゴリ選定モジュール2035は、第1尤度の値と第2尤度の値とを乗じることで、それぞれのカテゴリにおける評価指標を算出する。ここで、カテゴリ選定モジュール2035は、第1尤度の値と第2尤度の値とを乗じて得た値に対して、予め設定された任意の正規化を行って評価指標の値としてもよい。
なお、評価指標の計算方法としては、この例に限られない。例えば、第1尤度および第2尤度の少なくとも一方に重みづけを行ったうえで、加算又は乗算により評価指標を算出してもよい。また、第1尤度と第2尤度とを変数とする評価指標を算出する関数を予め設定してもよい。
【0093】
ステップS2032の後に、質問回答サーバ20は、算出された評価指標に基づき、カテゴリを選定する(ステップS2033)。
具体的には、質問回答サーバ20のカテゴリ選定モジュール2035は、質問回答DB2022に設定された複数のカテゴリのうち、評価指標が最も高い評価となるカテゴリを選択する。この際、カテゴリ選定モジュール2035は、評価指標の上位n件のカテゴリを選択してもよい。
これにより、図8に示すカテゴリの選定の処理(ステップS203)が終了する。
【0094】
図8に示すように、ステップS203の後に、質問回答サーバ20は、回答を出力する(ステップS204)。
具体的には、質問回答サーバ20の回答出力モジュール2036は、質問回答DB2022を参照し、カテゴリ選定モジュール2035により選定されたカテゴリに紐づけられた回答パターンを特定し、テキストデータとしてユーザ端末10に回答する。
【0095】
ステップS204の後に、ユーザ端末10は、受信した回答を表示する(ステップS102)。
具体的には、ユーザ端末10の制御部170は、回答に関するテキスト情報を、ディスプレイ132に出力する。これにより、ユーザに対して、入力した質問への質問回答サーバ20からの回答が提示される。
【0096】
ステップS102の後に、質問回答サーバ20は、アンケートを出力する(ステップS205)。
具体的には、質問回答サーバ20のアンケート取得モジュール2037は、回答の妥当性に関する評価の入力を受け付けるアンケートをユーザ端末10に対して送信する。
【0097】
ステップS205の後に、ユーザ端末10は、受信したアンケートを表示する(ステップS103)。
具体的には、ユーザ端末10の制御部170は、回答の妥当性に関するアンケートを、ディスプレイ132に出力する。これにより、ユーザに対して、回答の妥当性に関するアンケートが提示される。
【0098】
ステップS103の後に、ユーザ端末10は、アンケートへの回答を受け付ける(ステップS104)。
具体的には、ユーザ端末10の制御部170は、アンケートへのユーザからの回答の入力を受け付け、データ処理部173の処理に従って、送受信部172を介して質問回答サーバ20に送信する。
【0099】
ステップS104の後に、質問回答サーバ20は、アンケートへの回答を取得する(ステップS206)。
具体的には、質問回答サーバ20の送受信制御モジュール2031は、ユーザ端末10から送信されたアンケートへの回答に関する情報を取得する。
以上により、対話形式のテキスト入力インタフェースによる自動応答の処理が終了する。
【0100】
次に、質問回答サーバ20による学習用データの選定の処理について説明する。図10は、質問回答サーバ20による学習用データの選定の処理のフローを説明する図である。
質問回答サーバ20における学習用データ選定モジュール2038は、管理からの操作を受け付け、行動分類モデル2026に学習される学習用データの選定を行う。管理者は、行動分類モデル2026の識別性能(第2尤度の妥当性)を維持、向上するために、行動分類モデル2026に再学習させるデータを準備する。
【0101】
具体的には、行動分類モデル2026に再学習させるための学習用データを選定するために、管理者は、蓄積された操作ログおよび回答に対する評価結果から、学習用データの選定に関する指示を質問回答サーバ20に入力する。
なお、質問回答サーバ20により選定された行動分類モデル2026への学習用データは、再学習への利用に限定されず、その後に新たに生成される行動分類モデル2026の機械学習に用いてもよい。
【0102】
図10に示すように、学習用データの選定の処理では、質問回答サーバ20が、質問に関連する行動ログを抽出する(ステップS211)。
具体的には、質問回答サーバ20の学習用データ選定モジュール2038は、操作ログDB2023を参照して、蓄積された操作ログのうち、自動応答システム1を用いて質問をした操作に関する操作ログ、および直前の操作に関する操作ログを抽出する。
【0103】
ここで、直前の操作ログとは、操作日時を基準とし、質問に関する操作が行われた時点から、所定時間前の範囲で行われた操作に関する操作ログを指す。なお、この説明において、自動応答システム1を用いて質問をした操作に関する操作ログ、および直前の操作に関する操作ログをまとめて、質問文の入力に関する一連の操作ログという。
【0104】
例えば、自動応答システム1を用いてログインに関する問い合わせ(パスワードの再発行)を行ったユーザは、その直前にログインを試みてエラーがでるという操作を行っていることが想定される。このため、質問の内容と、質問の直前の操作には、一定の関連性がある場合がある。そこで、学習用データ選定モジュール2038は、質問文の入力に関する操作ログ、およびその直前の操作に関する操作ログを、質問文の入力に関する一連の操作ログとして抽出する。
【0105】
ステップS211の後に、質問回答サーバ20は、抽出した一連の操作ログに対する回答へのアンケート結果を抽出する(ステップS212)。
具体的には、質問回答サーバ20の学習用データ選定モジュール2038は、以下の情報を抽出する。
・抽出した操作による質問において入力された質問文
・当該質問文に対して、質問回答サーバ20が選定したカテゴリおよび出力した回答文
・質問回答サーバ20からの回答に対するユーザからのアンケート結果
【0106】
ステップS212の後に、質問回答サーバ20は、肯定的な評価を受けた回答に関する操作ログを特定する(ステップS213)。
具体的には、質問回答サーバ20の学習用データ選定モジュール2038は、抽出したアンケート結果を参照して、以下の情報を特定する。
・ユーザから肯定的な評価を受けた回答について、当該回答を得るために入力された質問に関する操作ログ
・肯定的な評価を受けた回答の内容(回答文およびカテゴリ)
【0107】
これにより、学習用データ選定モジュール2038は、質問をする直前になんらかの操作が行われた質問において、ユーザが求めている回答を得られた質問を特定し、当該質問の直前に行われた操作に関する操作ログを特定することができる。言い換えれば、学習用データ選定モジュール2038は、質問文の入力に関する一連の操作ログと関連性が高い回答内容(カテゴリ、回答文)を特定することができる。
【0108】
ステップS213の後に、質問回答サーバ20は、特定した操作ログと、対応するカテゴリと、を選定する(ステップS214)。
具体的には、質問回答サーバ20の学習用データ選定モジュール2038は、特定した操作ログと、当該操作ログに係る質問に対して選定されたカテゴリと、を学習用データとして選定する。学習用データ選定モジュール2038は、選定した操作ログに関する操作ログIDを、学習用データDB2024における項目「操作ログID」に記録し、選定したカテゴリを学習用データDB2024における項目「回答カテゴリ」に記録する。この際、データIDが新たに割り振られ、学習用データDB2024における新たなレコードが記録される。
【0109】
学習用データ選定モジュール2038は、当該操作ログに係る質問への回答についてのアンケート結果の値を、評価スコアとして抽出し、学習用データDB2024に記録してもよい。評価スコアを参照することで、学習用データに含まれる操作ログと、操作ログに対して回答するべきカテゴリと、の関連の度合いを把握することができ、優先して学習するべき学習用データを選別することができる。
以上により、質問回答サーバ20による学習用データの選定の処理が終了する。
【0110】
<6.小括>
以上説明したように、自動応答システム1では、質問回答サーバ20が、質問文から算出された第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定する。すなわち、自動応答システム1では、従来のように質問文と予め設定された質問パターンとの比較だけではなく、ユーザの行動ログを考慮して、質問文に対して回答するべきカテゴリを選定する。このため、質問文の内容に加えて、ユーザの行動傾向を考慮してカテゴリを選定することができ、効率的に機械学習モデルの識別性能を向上することができる。
【0111】
また、自動応答システム1では、質問回答サーバ20が、質問分類モデル2025に対して、質問文を入力することで、複数のカテゴリそれぞれについて第1尤度を算出する。そして、質問分類モデル2025は、複数の質問パターンを入力データとし、複数の質問パターンそれぞれに対応する回答パターンが紐づけられた複数のカテゴリを正解出力データとする学習用データを用いた機械学習により作成されている。このため、第1尤度の算出を高い精度を行うことができる。
【0112】
また、自動応答システム1では、質問回答サーバ20が、質問分類モデル2025に対して変更を加えることなく、質問分類モデル2025から算出された第1尤度、および行動ログに基づいて、カテゴリを選定する。このため、既存の質問分類モデル2025を使用する応答システムに対する機能拡張により、自動応答システム1の機能を実現可能となり、自動応答システム1の導入を円滑に行うことができる。
【0113】
また、自動応答システム1では、質問分類モデル2025は、質問文と質問パターンとの類似度に基づいて、第1尤度の算出を行う。このため、類似度の値を用いて、定量的に第1尤度を算出することができる。
【0114】
また、自動応答システム1では、質問回答サーバ20が、複数のカテゴリそれぞれについて、第2尤度を算出し、第1尤度および第2尤度に基づいて、質問文が該当するカテゴリを選定する。このため、第1尤度とは独立した行動ログから評価される第2尤度を用いることで、多面的な評価により、質問が該当する適切なカテゴリを選定することができる。
【0115】
また、自動応答システム1では、質問回答サーバ20が、行動分類モデル2026に対して、行動ログを入力することで、複数のカテゴリそれぞれについて、第2尤度を算出する。
そして、行動分類モデル2026は、複数のユーザの行動ログを入力データとし、複数のユーザの行動ログそれぞれに対応する回答パターンが紐づけられた複数のカテゴリを正解出力データとする学習用データを用いた機械学習により作成されている。このため、第2尤度の算出を高い精度を行うことができる。
【0116】
また、自動応答システム1では、質問回答サーバ20が、過去のユーザからの質問文の入力に関する一連の行動ログと、当該質問文への回答についてのユーザからの評価結果を用いて、一連の行動ログに対応する回答カテゴリを学習用データとして選別する。
このため、ユーザによる自動応答システム1の利用により蓄積された操作ログおよびアンケート結果を用いて、行動分類モデル2026を再学習することができ、行動分類モデル2026の識別性能を効率的に向上することができる。
【0117】
また、自動応答システム1では、質問回答サーバ20が、第1尤度に対して第2尤度を乗じて得た評価指標に基づいて、カテゴリを選定する。このため、評価指標を定量的に算出することができる。
【0118】
<7.変形例>
自動応答システム1としての処理は、他の処理を行ってもよい。
例えば、カテゴリ選定モジュール2035は、カテゴリを選定する処理において、第1尤度、およびユーザの行動ログに加えて、ユーザの属性に基づいて、カテゴリを選定してもよい。このような変形例に係る自動応答システム1の構成および処理について詳述する。図11は、変形例に係る自動応答システム1の質問回答サーバ20Bの機能的な構成を示す図である。
【0119】
図11に示すように、質問回答サーバ20Bの制御部203は、第3尤度算出モジュール2039をさらに備えている。また、質問回答サーバ20Bの記憶部202は、属性分類モデル2027をさらに備えている。
【0120】
第3尤度算出モジュール2039は、質問を行ったユーザの属性から、質問回答DB2022に記憶された複数のカテゴリそれぞれについて、第3尤度を算出する。第3尤度とは、質問を行ったユーザの属性から推定される、当該ユーザが行った質問と、質問が該当するカテゴリとの関連の度合を示す指標である。言い換えれば、第3尤度とは、ユーザの属性から推定される、当該ユーザによる質問が、あるカテゴリに該当する尤もらしさを示す指標である。
【0121】
第3尤度算出モジュール2039は、属性分類モデル2027に対して、質問したユーザのユーザ属性を入力することで、複数のカテゴリそれぞれの第3尤度を算出する。ユーザ属性としては、ユーザDB2021に格納される個人情報、会員情報、および端末情報の少なくともいずれかの情報を用いることができる。
【0122】
属性分類モデル2027は、学習用データに基づき、モデル学習プログラムに従って機械学習モデルに機械学習を行わせることにより得られる。本実施形態において、属性分類モデル2027は、例えば、ユーザ属性の入力に対して、カテゴリ毎の第3尤度を出力するように学習されている。このとき、学習用データは、複数のユーザ属性を入力データとし、それぞれのユーザ属性のユーザが行った質問が該当するカテゴリを正解出力データとする。
【0123】
属性分類モデル2027は、例えば、複数の関数が合成されたパラメータ付き合成関数である。パラメータ付き合成関数は、複数の調整可能な関数、及びパラメータの組合せにより定義される。属性分類モデル2027は、上記の要請を満たす如何なるパラメータ付き合成関数であってもよいが、多層のネットワークモデル(以下、多層化ネットワークと呼ぶ)であるとする。多層化ネットワークを用いる属性分類モデル2027は、ユーザ属性を入力する入力層と、第3尤度を出力する出力層と、入力層と出力層との間に設けられる少なくとも1層の中間層あるいは隠れ層とを有する。属性分類モデル2027は、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定される。
【0124】
本実施形態に係る多層化ネットワークとしては、例えば、深層学習(Deep Learning)の対象となる多層ニューラルネットワークである深層ニューラルネットワーク(Deep Neural Network:DNN)が用いられ得る。DNNとしては、例えば、時系列情報等を対象とする再帰型ニューラルネットワーク(Recurrent Neural Network:RNN)を用いてもよい。また、自然言語を対象とする自己注意機構付きネットワークを用いてもよい。
【0125】
第3尤度の算出では、属性分類モデル2027は、過去の回答結果の実績から、統計的に第3尤度を算出することができる。
具体的には、属性分類モデル2027は、過去に質問を行ったユーザのユーザ属性と、回答されたそれぞれのカテゴリに関する確立分布を算出し、当該ユーザ属性に対応するカテゴリごとの第3尤度とすることができる。
また、属性分類モデル2027は、ユーザが過去に行った質問のうち、回答後のアンケートで肯定的な評価を得られた割合について、回答されたそれぞれのカテゴリを変数とする確立分布を算出し、当該ユーザ属性に対応するカテゴリごとの第3尤度としてもよい。
【0126】
第3尤度算出モジュール2039は、少なくとも図9に示すステップS2032の前に、第3尤度を算出する。そして、カテゴリ選定モジュール2035は、図9に示すステップS2032において、第1尤度および第2尤度に加えて、第3尤度を用いてカテゴリの評価指標を算出する。カテゴリ選定モジュール2035は、図9に示すステップS2033において、第3尤度も用いた評価指標に基づき、カテゴリを選定する。
【0127】
変形例に係る質問回答サーバ20では、学習用データ選定モジュール2038は、行動分類モデル2026に対して学習させる学習用データを選定する処理に加えて、属性分類モデル2027に対して学習させる学習用データを選定する処理を行ってもよい。
この場合には、学習用データ選定モジュール2038は、過去に質問を行ったユーザのユーザ属性と、ユーザ属性に対応する回答カテゴリのうち、評価が高かった組み合わせを、学習用データとして選別してもよい。
【0128】
また、前述した変形例では、質問回答サーバ20が、第2尤度を算出する第2尤度算出モジュール2034、および第3尤度を算出する第3尤度算出モジュール2039を備え、それぞれのモジュールが、個別に第2尤度および第3尤度を算出する処理を説明したが、このような態様に限られない。
すなわち、質問回答サーバ20は、行動ログとユーザ属性の両方を用いて、質問が、あるカテゴリに該当する尤もらしさを示す第4尤度を算出し、第1尤度と第4尤度に基づいて、回答するべきカテゴリを選定してもよい。
この場合には、第4尤度を算出する分類モデル(行動・属性分類モデル)として、行動ログおよびユーザ属性の入力に対して、第4尤度を出力する機械学習モデルを採用することができる。行動・属性分類モデルは、行動ログおよびユーザ属性を入力データとし、当該行動ログおよびユーザ属性に該当する質問への適切な回答カテゴリを盛夏期学習データとした機械学習により作成される。
【0129】
<8.その他の変形例>
その他の変形例として、質問回答DB2022は、コンピュータにプログラムを実装するサーバにより実現されてもよい。質問回答サーバ20を構成する各部は、複数のコンピュータに分散して実現されていても構わない。
【0130】
また、質問回答サーバ20は、質問文に基づいたカテゴリの選定に加えて、ユーザの行動ログに基づいたカテゴリの選定をすることなく、ユーザの属性に基づいたカテゴリの選定を行ってもよい。すなわち、質問回答サーバ20は、第2尤度を算出することなく、第1尤度および第3尤度を用いて、カテゴリを選定するための評価指標を算出してもよい。
【0131】
また、質問回答サーバ20は、第2尤度を算出することなく、第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定してもよい。
また、質問回答サーバ20は、第3尤度を算出することなく、第1尤度、およびユーザのユーザ属性に基づいて、質問文が該当するカテゴリを選定してもよい。
【0132】
以上、本開示の実施形態について説明したが、設計上の都合やその他の要因によって必要となる様々な修正や組み合わせは、請求項に記載されている発明や発明の実施形態に記載されている具体例に対応する発明の範囲に含まれるものとする。
【0133】
<9.付記>
本発明の内容を以下に付記する。
【0134】
(付記1)
プロセッサと、メモリとを備えるコンピュータに実行させるためのプログラムであって、プログラムは、プロセッサに、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップ(ステップS202)と、
算出された第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定するステップ(ステップS203)と、
選定されたカテゴリに紐づけられた回答パターンを、ユーザ端末に対して出力するステップ(ステップS205)と、を実行させる、プログラム。
【0135】
(付記2)
第1尤度を算出するステップ(ステップS203)では、
複数の質問パターンを入力データとし、複数の質問パターンそれぞれが該当するカテゴリを正解出力データとする学習用データを用いた機械学習により作成された質問分類モデル2025に対して、質問文を入力することで、複数のカテゴリそれぞれについて、第1尤度を算出する、付記1に記載のプログラム。
【0136】
(付記3)
カテゴリを選定するステップ(ステップS203)では、
質問分類モデル2025に対して変更を加えることなく、質問分類モデル2025から算出された第1尤度および行動ログに基づいて、カテゴリを選定する、付記2に記載のプログラム。
【0137】
(付記4)
カテゴリを選定するステップ(ステップS203)では、プロセッサに、
行動ログに基づいて、記憶部に記憶された複数のカテゴリそれぞれについて、行動ログから推定される行動ログとの関連の度合いを示す第2尤度を算出するステップ(ステップS2031)と、
第1尤度および第2尤度に基づいて、質問文が該当するカテゴリを選定するステップ(ステップS2033)と、を実行させる、付記1から3のいずれかに記載のプログラム。
【0138】
(付記5)
第2尤度を算出するステップ(ステップS2031)では、
複数のユーザの行動ログを入力データとし、行動ログそれぞれの後に行われた質問に対して適切な回答とされるカテゴリを正解出力データとする学習用データを用いた機械学習により作成された行動分類モデル2026に対して、行動ログを入力することで、複数のカテゴリそれぞれについて、第2尤度を算出する、付記4に記載のプログラム。
【0139】
(付記6)
プロセッサに、
過去のユーザからの質問文の入力に関する一連の行動ログと、当該質問文に対して選定されたカテゴリについてのユーザからの評価結果を用いて、一連の行動ログに対応して回答されたカテゴリを、行動分類モデル2026への学習用データとして選別するステップ(ステップS214)を実行させる、付記5に記載のプログラム。
【0140】
(付記7)
第1尤度および第2尤度に基づいて、カテゴリを選定するステップ(ステップS203)では、
第1尤度に対して第2尤度を乗じて得た評価指標に基づいて、カテゴリを選定する、付記4から6のいずれか1項に記載のプログラム。
【0141】
(付記8)
カテゴリを選定するステップ(ステップS203)では、
算出された第1尤度、およびユーザの行動ログに加えて、ユーザの属性に基づいて、カテゴリを選定する、付記1から7のいずれかに記載のプログラム。
【0142】
(付記9)
プロセッサと、メモリとを備えるコンピュータが実行するための方法であって、方法は、プロセッサが、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップ(ステップS202)と、
算出された第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定するステップ(ステップS203)と、
選定されたカテゴリに紐づけられた回答パターンを、ユーザ端末に対して出力するステップ(ステップS205)と、を実行する、方法。
【0143】
(付記10)
プロセッサと、メモリとを備えるコンピュータにより実現されるシステムであって、システムは、プロセッサが、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出する手段と、
算出された第1尤度、およびユーザの行動ログに基づいて、質問文が該当するカテゴリを選定する手段と、
選定されたカテゴリに紐づけられた回答パターンを、ユーザ端末に対して出力する手段と、を備える、システム。
【符号の説明】
【0144】
1 自動応答システム
10 ユーザ端末
20、20B 質問回答サーバ
202 記憶部
2021 ユーザデータベース
2022 質問回答データベース
2023 操作ログデータベース
2024 学習用データデータベース
2025 質問分類モデル
2026 行動分類モデル
2027 属性分類モデル
203 制御部
2031 送受信制御モジュール
2032 質問文取得モジュール
2033 第1尤度算出モジュール
2034 第2尤度算出モジュール
2035 カテゴリ選定モジュール
2036 回答出力モジュール
2037 アンケート取得モジュール
2038 学習用データ選定モジュール
2039 第3尤度算出モジュール
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
【手続補正書】
【提出日】2023-02-02
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
プロセッサと、メモリとを備えるコンピュータに実行させるためのプログラムであって、前記プログラムは、前記プロセッサに、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、前記記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、前記質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップと、
算出された前記第1尤度、および前記ユーザの行動ログに基づいて、前記質問文に対して回答するべき前記回答パターンが紐づけられた前記カテゴリを選定するステップと、
選定された前記カテゴリに紐づけられた前記回答パターンを、前記ユーザ端末に対して出力するステップと、を実行させる、プログラム。
【請求項2】
前記カテゴリを選定するステップでは、前記プロセッサに、
前記行動ログに基づいて、前記記憶部に記憶された複数の前記カテゴリそれぞれについて、前記行動ログから推定される前記行動ログとの関連の度合いを示す第2尤度を算出するステップと、
前記第1尤度および前記第2尤度に基づいて、前記質問文に対して回答するべき前記回答パターンが紐づけられた前記カテゴリを選定するステップと、を実行させる、請求項1に記載のプログラム。
【請求項3】
前記第2尤度を算出するステップでは、
複数のユーザの行動ログを入力データとし、前記行動ログそれぞれの後に行われた質問に対して適切な回答とされる前記カテゴリを正解出力データとする学習用データを用いた機械学習により作成された行動分類モデルに対して、前記行動ログを入力することで、複数の前記カテゴリそれぞれについて、前記第2尤度を算出する、請求項に記載のプログラム。
【請求項4】
前記プロセッサに、
過去のユーザからの前記質問文の入力に関する一連の行動ログと、当該質問文に対して選定された前記カテゴリについての前記ユーザからの評価結果を用いて、前記一連の行動ログに対応して回答された前記カテゴリを、前記行動分類モデルへの前記学習用データとして選別するステップを実行させる、請求項に記載のプログラム。
【請求項5】
前記第1尤度および前記第2尤度に基づいて、前記カテゴリを選定するステップでは、
前記第1尤度に対して前記第2尤度を乗じて得た評価指標に基づいて、前記カテゴリを選定する、請求項2から4のいずれか1項に記載のプログラム。
【請求項6】
前記第1尤度を算出するステップでは、
複数の前記質問パターンを入力データとし、複数の前記質問パターンそれぞれが該当する前記カテゴリを正解出力データとする学習用データを用いた機械学習により作成された質問分類モデルに対して、前記質問文を入力することで、複数の前記カテゴリそれぞれについて、前記第1尤度を算出する、請求項1から4のいずれか1項に記載のプログラム。
【請求項7】
前記カテゴリを選定するステップでは、
前記質問分類モデルに対して変更を加えることなく、前記質問分類モデルから算出された前記第1尤度および前記行動ログに基づいて、前記カテゴリを選定する、請求項に記載のプログラム。
【請求項8】
前記カテゴリを選定するステップでは、
算出された前記第1尤度、および前記ユーザの行動ログに加えて、前記ユーザの属性に基づいて、前記カテゴリを選定する、請求項1に記載のプログラム。
【請求項9】
プロセッサと、メモリとを備えるコンピュータが実行するための方法であって、前記方法は、前記プロセッサが、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、前記記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、前記質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出するステップと、
算出された前記第1尤度、および前記ユーザの行動ログに基づいて、前記質問文に対して回答するべき前記回答パターンが紐づけられた前記カテゴリを選定するステップと、
選定された前記カテゴリに紐づけられた前記回答パターンを、前記ユーザ端末に対して出力するステップと、を実行する、方法。
【請求項10】
プロセッサと、メモリとを備えるコンピュータにより実現されるシステムであって、前記システムは、前記プロセッサが、
ユーザ端末からユーザが入力した質問文と、記憶部に記憶された質問パターンと、に基づいて、前記記憶部に記憶され、回答パターンが紐づけられた複数のカテゴリそれぞれについて、前記質問文から推定される当該質問文との関連の度合いを示す第1尤度を算出する手段と、
算出された前記第1尤度、および前記ユーザの行動ログに基づいて、前記質問文に対して回答するべき前記回答パターンが紐づけられた前記カテゴリを選定する手段と、
選定された前記カテゴリに紐づけられた前記回答パターンを、前記ユーザ端末に対して出力する手段と、を備える、システム。