特開2023-162940 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ペネトレイト・オブ・リミット株式会社の特許一覧

特開2023-162940サーバ

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5A
5B
5C
5D
5E
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023162940

(43)【公開日】2023-11-09

(54)【発明の名称】サーバ

(51)【国際特許分類】

G06F 16/90 20190101AFI20231101BHJP

G06F 40/56 20200101ALI20231101BHJP

【ＦＩ】

G06F16/90 100

G06F40/56

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2022073667

(22)【出願日】2022-04-27

(71)【出願人】

【識別番号】522075232

【氏名又は名称】ペネトレイト・オブ・リミット株式会社

(74)【代理人】

【識別番号】100104776

【弁理士】

【氏名又は名称】佐野弘

(74)【代理人】

【識別番号】100119194

【弁理士】

【氏名又は名称】石井明夫

(72)【発明者】

【氏名】宮下伸也

【テーマコード（参考）】

5B091

5B175

【Ｆターム（参考）】

5B091AA15

5B091AB17

5B091CA02

5B091CA21

5B091CC02

5B091EA01

5B175EA01

5B175FA01

5B175FB04

5B175GC03

(57)【要約】（修正有）

【課題】短期間で高精度なチャットボットシステムを生成するサーバを提供する。
【解決手段】チャットボットシステム１において、端末２とネットワーク４により接続され、質問情報の入力に対して回答情報を生成するチャットボット管理するサーバ３は、受信手段と、辞書情報記憶手段と、学習手段と、送信手段とを備える。受信手段は、端末から質問情報及び学習データとして所定の情報を受信する。学習手段は、受信手段が受信した所定の情報がファイルである場合には、ファイルに保存されている文章を、受信手段が受信した所定の情報がＵＲＬの場合には、ＵＲＬのウェブページに表示されている文章を、辞書記憶手段に記憶されている辞書情報を参照して、文章を自然言語処理した後に、学習データとして学習するとともに、質問情報に対して複数の回答情報を生成する。送信手段は、学習手段が生成した、質問情報に応じて複数の回答情報を端末に対して送信する。
【選択図】図１

【特許請求の範囲】

【請求項1】

端末とネットワークにより接続され、質問情報の入力に対して回答情報を生成するチャットボットを管理するサーバであって、
前記サーバは、前記端末から質問情報及び学習データとして所定の情報を受信する受信手段と、
所定の辞書情報が記憶されている辞書情報記憶手段と、
前記受信手段が受信した前記所定の情報がファイルである場合には、該ファイルに保存されている文章を、前記受信手段が受信した前記所定の情報がＵＲＬの場合には、該ＵＲＬのウェブページに表示されている文章を、前記辞書記憶手段に記憶されている前記辞書情報を参照して、前記文章を自然言語処理した後に、学習データとして学習するとともに、前記質問情報に対して複数の前記回答情報を生成する学習手段と、
該学習手段が生成した、前記質問情報に応じて複数の前記回答情報を前記端末に対して送信する送信手段と、を備えている
ことを特徴とするサーバ。

【請求項2】

前記送信手段は、複数の前記回答情報として画像情報及び文字情報を前記端末に対して送信し、前記端末において前記画像情報及び前記文字情報を表示させる
ことを特徴とする請求項１に記載のサーバ。

【請求項3】

前記受信手段は、前記端末に表示された複数の前記回答情報のうち前記端末で選択の入力を受け付けた前記回答情報に関する情報を受信し、
前記学習手段は、前記受信手段が受信した前記回答情報に関する情報を学習データとしてさらに学習する
ことを特徴とする請求項１に記載のサーバ。

【請求項4】

前記受信手段は、前記端末に表示された複数の前記回答情報のうち前記端末で選択の入力を受け付けた前記回答情報に関する情報を受信し、
前記学習手段は、前記受信手段が受信した前記回答情報に関する情報を学習データとしてさらに学習する
ことを特徴とする請求項２に記載のサーバ。

【請求項5】

前記受信手段は、前記端末で選択の入力を受け付けた前記画像情報及び／又は前記文字情報に関する情報を受信し、
前記学習手段は、前記受信手段が受信した前記画像情報及び／又は前記文字情報に関する情報に応じてポイントを付与し、該ポイントに応じて前記回答情報として前記画像情報及び／又は前記文字情報の表示順位が決定される
ことを特徴とする請求項２に記載のサーバ。

【請求項6】

【請求項7】

【請求項8】

前記学習手段は、学習の過程において、前記文章を構成する各単語をベクトルに変換した第一ベクトルと、前記文章をベクトルに変換した第二ベクトルと、前記質問情報を構成する各単語をベクトルに変換した第三ベクトルとを演算して、前記第一ベクトルと、前記第三ベクトルとの類似度を計算するとともに、前記第二ベクトルと、前記第三ベクトルとの類似度を計算して、前記回答情報を生成し、
前記送信手段は、前記第一ベクトルと、前記第三ベクトルとの類似度、及び前記第二ベクトルと、前記第三ベクトルとの類似度に基づいて、前記文章との類似割合が高い順に、前記質問情報に応じた複数の前記回答情報として前記画像情報及び／又は前記文字情報を前記端末に送信し、前記端末に前記画像情報及び／又は前記文字情報を表示させる
ことを特徴とする請求項１から請求項７までのいずれか１項に記載のサーバ。

【請求項9】

前記学習手段は、前記学習データとしての前記文章に含まれる特徴量と、前記質問情報に含まれる特徴量とに基づいて、前記類似度の計算をする
ことを特徴とする請求項８に記載のサーバ。

【請求項10】

前記学習手段は、前記ファイルが更新された場合及び／又は前記ＵＲＬのウェブページが更新された場合に、所定の入力を受け付けることによって、更新された前記ファイルに保存されている文章及び／又は更新された前記ウェブページに表示されている文章を自然言語処理し、自然言語処理をした前記文章を学習データとして学習する
ことを特徴とする請求項１又は請求項２に記載のサーバ。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、チャットボットサーバに関する。

【背景技術】

【0002】

特許文献１に記載の発明のように、チャットシナリオに必要な情報を取得して、チャットシナリオを生成するチャットボット制御装置が開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２１－１１７６９０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、チャットボットを稼働させるためにシナリオを作成するのに負担が生じ、チャットボットを導入するために時間を要することになってしまう。

【0005】

本発明はこのような事情に鑑みてなされたものであり、本発明は、既存の資料を活用して、チャットボット導入時における負担を軽減するだけでなく、精度の高いチャットボットを提供することである。

【課題を解決するための手段】

【0006】

かかる課題を解決するために、請求項１に記載の発明は、端末とネットワークにより接続され、質問情報の入力に対して回答情報を生成するチャットボットを管理するサーバであって、前記サーバは、前記端末から質問情報及び学習データとして所定の情報を受信する受信手段と、所定の辞書情報が記憶されている辞書情報記憶手段と、前記受信手段が受信した前記所定の情報がファイルである場合には、該ファイルに保存されている文章を、前記受信手段が受信した前記所定の情報がＵＲＬの場合には、該ＵＲＬのウェブページに表示されている文章を、前記辞書記憶手段に記憶されている前記辞書情報を参照して、前記文章を自然言語処理した後に、学習データとして学習するとともに、前記質問情報に対して複数の前記回答情報を生成する学習手段と、該学習手段が生成した、前記質問情報に応じて複数の前記回答情報を前記端末に対して送信する送信手段と、を備えていることを特徴とする。

【0007】

他の発明は、前記送信手段は、複数の前記回答情報として画像情報及び文字情報を前記端末に対して送信し、前記端末において前記画像情報及び前記文字情報を表示させることを特徴とする。

【0008】

他の発明は、前記受信手段は、前記端末に表示された複数の前記回答情報のうち前記端末で選択の入力を受け付けた前記回答情報に関する情報を受信し、前記学習手段は、前記受信手段が受信した前記回答情報に関する情報を学習データとしてさらに学習することを特徴とする。

【0009】

他の発明は、前記受信手段は、前記端末で選択の入力を受け付けた前記画像情報及び／又は前記文字情報に関する情報を受信し、前記学習手段は、前記受信手段が受信した前記画像情報及び／又は前記文字情報に関する情報に応じてポイントを付与し、該ポイントに応じて前記回答情報として前記画像情報及び／又は前記文字情報の表示順位が決定されることを特徴とする。

【0010】

他の発明は、前記学習手段は、学習の過程において、前記文章を構成する各単語をベクトルに変換した第一ベクトルと、前記文章をベクトルに変換した第二ベクトルと、前記質問情報を構成する各単語をベクトルに変換した第三ベクトルとを演算して、前記第一ベクトルと、前記第三ベクトルとの類似度を計算するとともに、前記第二ベクトルと、前記第三ベクトルとの類似度を計算して、前記回答情報を生成し、前記送信手段は、前記第一ベクトルと、前記第三ベクトルとの類似度、及び前記第二ベクトルと、前記第三ベクトルとの類似度に基づいて、前記文章との類似割合が高い順に、前記質問情報に応じた複数の前記回答情報として前記画像情報及び／又は前記文字情報を前記端末に送信し、前記端末に前記画像情報及び／又は前記文字情報を表示させることを特徴とする。

【0011】

他の発明は、前記学習手段は、前記学習データとしての前記文章に含まれる特徴量と、前記質問情報に含まれる特徴量とに基づいて、前記類似度の計算をすることを特徴とする。

【0012】

他の発明は、前記学習手段は、前記ファイルが更新された場合及び／又は前記ＵＲＬのウェブページが更新された場合に、所定の入力を受け付けることによって、更新された前記ファイルに保存されている文章及び／又は更新された前記ウェブページに表示されている文章を自然言語処理し、自然言語処理をした前記文章を学習データとして学習することを特徴とする。

【発明の効果】

【0013】

請求項１の発明によれば、様々なマニュアルなどが記録されているファイルや、ＦＡＱ（ＦｒｅｑｕｅｎｔｌｙＡｓｋｅｄＱｕｅｓｔｉｏｎｓ）などが表示されているウェブページのＵＲＬを選択して学習させることによって、短期間で、かつ、高精度のチャットボットを管理するサーバを生成することができる。

【0014】

他の発明によれば、回答情報として画像情報及び／又は文字情報を表示させることによって、視認性が優れているので、ユーザにとって必要と思われる情報を選択しやすくすることができる。

【0015】

他の発明によれば、表示された回答情報のうち選択の入力を受け付けた回答情報に関する情報を学習データとしてさらに学習するため、より精度の高いチャットボットを生成することができる。

【0016】

他の発明によれば、前記学習手段は、前記受信手段が受信した前記画像情報及び／又は前記文字情報に関する情報に応じてポイントを付与し、該ポイントに応じて前記回答情報として前記画像情報及び／又は前記文字情報の表示順位が決定されるので、チャットボットを使用し続けることによって、ユーザが求めている回答が表示される確度が高くなり、さらなるユーザの利便性の向上に資することができる。

【0017】

他の発明によれば、ベクトルの類似度が計算されることによって、ユーザが求めている回答と同一又は回答に近いものを類似度に従って表示させることができるので、質問情報に対する回答情報の生成の精度を高くすることができる。

【0018】

他の発明によれば、ベクトルの類似度に加えて、学習データとしての文章に含まれる特徴量と、質問情報に含まれる特徴量とに基づいて、類似度の計算をするため、質問情報に対する回答情報の生成の精度をさらに高くすることができる。

【0019】

他の発明によれば、マニュアルやＦＡＱが更新された場合に、所定の入力を受け付けることによってチャットボットを更新することができ、チャットボットを管理するサーバ及びチャットボットの回答を準備するためなどのチャットボット自体の維持管理のためのメンテナンスの負担の軽減を図ることができる。

【図面の簡単な説明】

【0020】

【図1】この発明の実施の形態に係るチャットボットシステム１の全体構造を示す機能ブロック図である。

【図2】この発明の実施の形態に係るチャットボットに関する学習済みモデルが生成されるまでのフローチャートを示す図である。

【図3】この発明の実施の形態に係るサーバ３が備える学習手段３３が学習データを学習する過程において、単語の分割と一般化をする際のフローチャートを示す図である。

【図4】この発明の実施の形態に係るチャットボットシステム１が生成される過程の画面の遷移を示す図である。

【図5A】この発明の実施の形態に係るチャットボットに関する学習済みモデルが質問情報の入力から回答情報を出力するまでの過程のうち、最初に表示される画面の例を示す図である。

【図5B】この発明の実施の形態に係るチャットボットに関する学習済みモデルが質問情報の入力から回答情報を出力するまでの過程のうち、質問情報の入力を受け付けている画面の例を示す図である。

【図5C】この発明の実施の形態に係るチャットボットに関する学習済みモデルが回答情報を生成し、生成された回答情報が表示されている画面の例を示す図である。

【図5D】この発明の実施の形態に係るチャットボットに関する学習済みモデルが生成した複数の回答情報のうち選択の入力を受け付けた回答情報を表示している画面の例を示す図である。

【図5E】この発明の実施の形態に係るチャットボットに関する学習済みモデルが生成した回答情報について精度に関する選択肢を表示している画面の例を示す図である。

【図6】この発明の実施の形態に係るチャットボットに関する学習済みモデルが生成された後に、質問情報の受信から回答情報の生成までのフローチャートを示す図である。

【発明を実施するための形態】

【0021】

この発明の実施の形態について、図１から図６までを用いて説明する。

【0022】

図１は、この発明の実施の形態に係るチャットボットシステム１の全体構造を示す機能ブロック図である。

【0023】

図１に示すとおり、チャットボットシステム１は、端末２と、チャットボットに関する学習済みモデルなどが格納されているサーバ３とを備えている。端末２は、たとえば、パーソナルコンピュータ、タブレット端末、スマートフォンなどである。端末２は、端末２ａと、端末２ｂとからなり、主にチャットボットシステム１を管理する管理者が使用し、サーバ３と各種の情報を交信するための端末２ａと、主にチャットボットシステム１を利用するユーザが使用し、サーバ３と各種の情報を交信するための端末２ｂとからなる。端末２ａ、端末２ｂと、サーバ３との間はネットワーク４で接続されている。なお、図１においては、端末２ａと端末２ｂとの２台の端末が示されているが、管理者とユーザとが共同で使用する１台の端末に後述する端末のすべての機能（端末２ａと端末２ｂとが備える機能）を備えていても良いし、一人又は複数人の管理者と、一人又は複数人のユーザとが使用する３台以上の端末を備え、３台以上の端末にそれぞれの機能を備えさせても良い。

【0024】

端末２ａは、学習手段３３に学習を指示する学習指示手段２１と、サーバ３との間で各種の情報を交信する送受信手段２２と、サーバ３から受信した情報を表示する第一表示手段２３と、を備えている。

【0025】

学習指示手段２１は、サーバ３が備えている学習手段３３に対して、学習データとして所定の情報を学習することを指示する。所定の情報とは、たとえば、マニュアル情報が保存されているファイルや、よくある質問とその質問に対する回答であるＦＡＱが掲載されているウェブページのＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ）である。学習指示手段２１が学習手段３３に学習データとして学習させるファイル形式は、どのようなものでもよく、たとえば、ｗｏｒｄやＰＤＦファイルでもよい。学習指示手段２１による学習段階のフロー及び画像の例については、図２及び図４において、説明する。

【0026】

送受信手段２２は、サーバ３との間で各種の情報を交信する。送受信手段２２からサーバ３へ送信する情報の例としては、辞書情報記憶手段３２に記憶させる辞書情報や、質問情報、回答情報、質問情報に関連付けられた分類タグに関する情報などである。分類タグについては、後述する。また、送受信手段２２がサーバ３から受信する情報の例としては、分析手段３６が分析した回答情報に関する情報や、チャットボットシステム１の利用状況に関する情報、追加学習に関する情報などである。詳細は、後述する。

【0027】

第一表示手段２３は、送受信手段２２がサーバ３から受信した情報を表示する。第一表示手段２３は、情報を表示する機能を有するものであればよく、ディスプレイやプロジェクタなどである。第一表示手段２３は、たとえば、サーバ３から受信した、分析手段３６が分析した回答情報に関する情報などを表示する。

【0028】

端末２ｂは、質問情報などの入力を受け付ける入力手段２６と、入力手段２６が入力を受け付けた質問情報などをサーバ３へ送信する端末送信手段２７と、サーバ３から回答情報を受信する端末受信手段２８と、端末受信手段２８が受信した回答情報を表示する第二表示手段２９と、を備えている。

【0029】

入力手段２６は、サーバ３へ送信する質問情報や、分類タグに関する情報、ユーザが選択した回答情報に関する情報の入力を受け付ける手段であり、たとえば、マウス、キーボード、タッチパネルなどである。入力手段２６が音声情報を文字情報に変換する機能を備えているのであれば、入力手段２６は、マイクなどの集音器であっても良い。入力手段２６は、ユーザが調べたい質問情報の入力を受け付ける。たとえば、チャットボットシステム１が社内問合せ用のものであれば、入力手段２６は、「有給休暇の取り方」などの情報を質問情報として入力を受け付ける。

【0030】

端末送信手段２７は、入力手段２６が入力を受け付けた質問情報などをサーバ３に送信する。たとえば、上記の例で説明をすると、端末送信手段２７は、入力手段２６が入力を受け付けた「有給休暇の取り方」という質問情報をサーバ３に送信する。また、端末送信手段２７は、後述する第二表示手段２９によって表示される複数の回答情報のうち入力手段２６がユーザによって選択の入力を受け付けた回答情報に関する情報をサーバ３に送信する。

【0031】

端末受信手段２８は、端末送信手段２７が送信した質問情報に応じて、後述する学習手段３３が生成する回答情報をサーバ３から受信する。たとえば、上記の例で説明をすると、「有給休暇の取り方」という質問情報に応じて、端末受信手段２８は、サーバ３から「就業規則」、「有給休暇を取得するための申請書の記入方法」、「有給休暇の残日数の確認方法」、「有給休暇を取得するための承認ルート」などの複数の回答情報を受信する。

【0032】

第二表示手段２９は、端末受信手段２８が受信した複数の回答情報を表示する。第二表示手段２９は、第一表示手段２３と同様に、情報を表示する機能を有するものであればよく、ディスプレイやプロジェクタなどである。第二表示手段２９は、たとえば、端末受信手段２８が受信した、複数の回答情報として、文字情報、画像情報、文字情報と画像情報との組合せを表示する。また、第二表示手段２９は、後述するポイントや特徴量に基づいた回答情報の精度に応じて、表示される回答情報に順序を設けてもよい。もっとも、第二表示手段２９が表示する回答情報の例としては、これらに限られず、図形や記号、キャラクターのリアクションなどであってもよい。なお、第二表示手段２９による回答情報の表示方法、表示順位などについては、後述する。

【0033】

サーバ３は、端末２から質問情報など各種の情報を受信するサーバ受信手段３１と、所定の辞書情報を記憶している辞書情報記憶手段３２と、辞書情報記憶手段３２に記憶されている辞書情報を参照して、所定の文章を自然言語処理した後に、質問情報に応じて複数の回答情報を生成する学習手段３３と、所定の情報を記憶している記憶手段３４と、学習手段３３が生成した複数の回答情報を端末２へ送信するサーバ送信手段３５と、回答情報などの情報を分析する分析手段３６と、を備えている。なお、サーバ３は、物理サーバで構成されてもよいし、仮想サーバで構成されてもよい。

【0034】

サーバ受信手段３１は、端末２ｂから送信された質問情報や、第二表示手段２９によって表示される複数の回答情報のうち入力手段２６がユーザによって選択の入力を受け付けた回答情報に関する情報を受信する。また、サーバ受信手段３１は、端末２ａから送信された、辞書情報記憶手段３２に記憶させる辞書情報を受信する。サーバ受信手段３１が受信する情報の具体的な処理については、後述する。

【0035】

辞書情報記憶手段３２は、所定の辞書情報として、後述する学習手段３３が回答情報を生成する際に参照される言葉を記憶している。具体的には、学習手段３３が自然言語処理をする過程において誤って単語を分割するのを防止するための単語や、同意語の組合せを記憶している。辞書情報記憶手段３２が記憶している単語は、単語の分割を防止するためのものとしては、たとえば、主に複数の名詞から構成される単語であり、「明治神宮野球場」や「東京タワー」（登録商標）などが該当する。辞書情報記憶手段３２が記憶している同意語の組合せとしては、「やりかた」と「方法」などである。辞書情報記憶手段３２は、公知の辞書情報データベースを用いたり、送受信手段２２から受信することによって、辞書情報として単語を記憶することができる。もっとも、辞書情報記憶手段３２に辞書情報としての単語を記憶させる方法としては、これらに限られない。

【0036】

学習手段３３は、学習段階と利用段階によって、機能が異なる。まず、学習段階における学習手段３３について、説明をする。学習手段３３は、学習手段３３が備えている学習済みモデルによって、学習指示手段２１により指示された所定の情報を学習する。所定の情報とは、上述のとおり、学習指示手段２１が指示した、マニュアル情報が保存されているファイルや、よくある質問とその質問に対する回答であるＦＡＱが掲載されているウェブページのＵＲＬである。学習手段３３は、ファイルに保存されている文章やウェブページに表示されている文章を学習データとして学習する。学習手段３３による学習段階の具体的なフローについて、図２を用いて説明をする。

【0037】

図２は、この発明の実施の形態に係るチャットボットに関する学習済みモデルが生成されるまでのフローチャートを示す図である。

【0038】

まず、学習手段３３が備えているチャットボットに関する学習済みモデルに学習データを入力する（ステップＳ２０１）。入力される学習データは、上述のとおり、ファイルに保存されている文章や、ＵＲＬのウェブページに表示されている文章である。

【0039】

次に、学習手段３３は、文章のクリーニング処理をする（ステップＳ２０２）。具体的には、文章に関係がない文字列などのノイズを除去する。ノイズの例としては、ウェブページの場合には、ＨＴＭＬ（ＨｙｐｅｒＴｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ）タグなどである。

【0040】

学習手段３３は、文章を単語ごとに分割し（ステップＳ２０３）、単語を一般化する（ステップＳ２０４）。単語の分割と正規化のフローについては、図３を用いて、説明をする。

【0041】

図３は、この発明の実施の形態に係るサーバ３が備える学習手段３３が学習データを学習する過程において、単語の分割と一般化をする際のフローチャートを示す図である。図３Ａにおいて、「ログインの仕方を教えて。」という文章が表示されている。次に、図３Ｂが示すとおり、学習手段３３は、形態素解析により、この文章を「ログイン」、「の」、「しかた」、「を」、「教え」、「て」と分割する。この際、学習手段３３は、文章において、数値で表現されていることを認識する数値表現と、時間的な表現であることを認識する時間表現と、期間や範囲に関する表現であることを認識する範囲表現と、否定表現とを組み合わせて文章を単語に分割することによって、正確な位置で単語を分割することができる。否定表現とは、通常の表現に「ない」という単語を組み合わせることであり、たとえば、「設定されていない」という表現を、「設定する」と「ない」という組合せにすることである。このような組合せによって、質問情報に否定形の文章が含まれている場合に検索されやすくなる。

【0042】

図３Ｃが示すとおり、文章に使われている品詞のうち不要な文字（たとえば助詞や助動詞）を削除して、「ログイン」、「しかた」、「教え」の単語が抽出されている。さらに、図３Ｄが示すとおり、辞書情報記憶手段３２が記憶している辞書情報を参照して、「しかた」を「方法」という単語へ一般化することによって、「ログイン」、「方法」、「教え」という単語が抽出される。一般化された単語の抽出により、単語の分割と正規化の処理は、終了する。

【0043】

図２に示すステップＳ２０５に戻り、学習手段３３は、ストップワードを除去する。学習手段３３による学習の過程において文章に含まれる単語の頻度を集計し、高頻度の単語をストップワードとして文章から除去をしてもよいし、ストップワードのデータベースを用いて、文章からストップワードを除去してもよい。

【0044】

ストップワードが除去された単語は、ベクトル化される（ステップＳ２０６）。ベクトル化の手段としては、たとえば、ｔｆ－ｉｄｆベクトル化（ＴｆｉｄｆＶｅｃｔｏｒｉｚｅｒ）が用いられ、ＢａｇＯｆＷｏｒｄｓやＷｏｒｄ２Ｖｅｃ、Ｄｏｃ２Ｖｅｃなどが用いられてもよい。

【0045】

単語のベクトル化が完了したときは、ストップワードが除去された文章をベクトル化する（ステップＳ２０７）。ベクトル化の手段としては、上記と同様に、たとえば、ｔｆ－ｉｄｆベクトル化（ＴｆｉｄｆＶｅｃｔｏｒｉｚｅｒ）を用いられる。

【0046】

ベクトル化された単語や文章に対して、分類タグを付すことができる（ステップＳ２０８）。分類タグとは、たとえば、質問情報のジャンルに関するものであり、社内向けのチャットボットシステム１であれば、「人事について」、「Ｗｅｂｍｔｇについて」、「ＰＣ操作方法について」などである。分類タグは、学習手段３３による学習の過程で自動的に付されるようにしてもよいし、送受信手段２２から分類タグに関する情報を送信されることにより、ベクトル化された単語や文章に分類タグを付すようにしてもよい。

【0047】

学習手段３３は、学習データがまだあるかどうか判定をし、学習データがないと判定をしたときは（ステップＳ２０９：Ｎｏ）、学習を終了する。学習手段３３は、学習データがまだあると判定したときは（ステップＳ２０９：Ｙｅｓ）、ステップＳ２０２に戻り、学習を行う。学習手段３３は、学習データがなくなるまで、これらの処理を繰り返す。これらの処理が完了すると、学習手段３３による学習段階における処理が完了し、チャットボットに関する学習済みモデルは完成する。

【0048】

次に、図４を用いて説明をする。図４は、この発明の実施の形態に係るチャットボットシステム１が生成される過程の画面の遷移を示す図である。

【0049】

図４の画面は、第一表示手段２３に表示されている。学習指示手段２１は、図４に示すＡの枠において、学習手段３３に学習データとして学習をさせるＵＲＬやファイルを選択することができる。学習指示手段２１は、学習データとして学習をさせるＵＲＬを選択する際に、サブドメインのＵＲＬやウェブページ内のファイルなどを学習の対象とするかどうか、設定することができるようにしてもよい。

【0050】

図４に示すＢを選択することによって、学習データとして学習するＵＲＬを追加することができる。

【0051】

図４に示すＣを選択することによって、学習手段３３による学習を開始する。第一表示手段２３において、学習手段３３による学習の開始から、チャットボットに関する学習済みモデルが完成するまでに要した時間を表示してもよい。さらには、第一表示手段２３は、学習データを取り込む段階（図４におけるＳｔｅｐ１）、学習データを整理する段階（図４におけるＳｔｅｐ２）、学習データを登録する段階（図４におけるＳｔｅｐ３）、チャットボットに関する学習済みモデルを作成する段階（図４におけるＳｔｅｐ４）のそれぞれに要した時間を表示しても良い。

【0052】

図１に戻り、学習手段３３による追加学習について説明をする。学習手段３３は、端末送信手段２７から、第二表示手段２９によって表示される複数の回答情報のうち入力手段２６がユーザによって選択の入力を受け付けた回答情報に関する情報を学習データとして、追加学習をする。たとえば、第二表示手段２９が複数の回答情報として文字情報と画像情報との組合せを表示した際に、複数の回答情報の全部又は一部について入力手段２６がユーザから選択の入力を受け付けた場合、端末送信手段２７から、その選択された回答情報に関する情報がサーバ受信手段３１に送信され、学習手段３３は、その情報を学習データとして追加学習をする。また、学習手段３３は、質問情報に含まれる単語と、回答情報の候補に含まれる単語との組合せについてポイントを付与する。ポイントとは、学習手段３３が回答情報を生成する過程において、質問情報に含まれる単語や文章のうち、回答情報として関連性が高いものについて、その質問情報と回答情報との組合せに付与されるものである。たとえば、第二表示手段２９が表示した複数の回答情報として文字情報と画像情報との組合せのうち、ユーザから選択の入力を受け付けたものがあるときは、その質問情報と回答情報とは、関連性が高いと判定される。学習手段３３が付与したポイントは、記憶手段３４において記憶され、学習手段３３が回答情報を生成する過程において、参照される。学習手段３３は、このポイントに応じて、第二表示手段２９に表示させる複数の回答情報の表示順位を決定することができる。

【0053】

次に、学習手段３３は、利用段階において、上記の学習段階において学習が完了したチャットボットに関する学習済みモデルによって、サーバ受信手段３１が受信した質問情報に応じて、複数の回答情報を生成する。学習手段３３は、回答情報を生成するに際して、辞書情報記憶手段３２が記憶している辞書情報や、記憶手段３４が記憶している単語の特徴量、単語や文章のポイントを参照する。利用段階における学習手段３３における具体的な画像の遷移については、図５Ａから図５Ｅまでを用いて説明をする。

【0054】

図５Ａから図５Ｅまでは、この発明の実施の形態に係るチャットボットに関する学習済みモデルが質問情報の入力から回答情報を出力するまでの画面の遷移を示す図である。

【0055】

図５Ａは、第二表示手段２９が表示している画像である。第二表示手段２９は、チャットボットが「こんにちは！こちらはテストチャットのヘルプボットです。質問をどうぞ。」とチャットをしている画像を表示している。

【0056】

図５Ｂは、第二表示手段２９が表示している、入力手段２６による質問情報の入力を受け付けている画像である。この際、後述する分類タグの設定がある場合には、入力手段２６は、分類タグの選択を受け付けるとともに、質問情報の入力を受け付けてもよい。図５Ｂにおいて、入力手段２６は、「人事給与」の分類タグの選択を受け付けるとともに、「年末調整について」という質問情報の入力を受け付けている。入力手段２６が「人事給与」という分類タグが選択されたという情報と、「年末調整について」という質問情報の入力を受け付けると、端末送信手段２７からサーバ受信手段３１へこれらの情報が送信される。

【0057】

図５Ｃは、学習手段３３が、サーバ受信手段３１が受信した「人事給与」という分類タグが選択されたという情報と、「年末調整について」という質問情報に基づいて回答情報を生成し、第二表示手段２９がこの回答情報を表示している画像である。第二表示手段２９は、複数の回答情報として画像情報と文字情報の組合せを３組表示している。図５Ｃにおいては、複数の回答情報として３組の回答情報を表示しているが、組合せの数は、限られない。なお、第二表示手段２９は、学習手段３３によって回答としての精度が高いと判定された回答情報から順に表示するようにしてもよいし、回答としての精度が高いと判定された回答情報が目立つように表示をしてもよい。

【0058】

図５Ｄは、第二表示手段２９において、入力手段２６が、図５Ｃで表示された、複数の回答情報としての画像情報と文字情報の組合せのうち選択の入力を受け付けた１つの組合せを表示していることを示す図である。端末送信手段２７は、入力手段２６が複数の回答情報のうち選択の入力を受け付けた情報をサーバ受信手段３１に送信し、学習手段３３は、サーバ受信手段３１が受信したこの情報を学習データとして追加学習をする。

【0059】

図５Ｅは、第二表示手段２９において、図５Ｄで表示された回答情報を閉じて、複数の回答情報として画像情報と文字情報の組合せが３組表示されているとともに、それぞれの回答情報の下部に「お役に立ちましたか？」と表示されていることを示す図である。第二表示手段２９は、「お役に立ちましたか？」という質問に対して、「はい」、「おしい」、「いいえ」の３つの選択肢を表示している。これらの選択肢のうち、「はい」を選択すれば、学習手段３３が生成した回答情報の精度が高く、「いいえ」を選択すれば、学習手段３３が生成した回答情報の精度は低く、「おしい」であれば、学習手段３３が生成した回答情報の精度は低くないと判定することができる。端末送信手段２７は、入力手段２６がこれらの選択肢のうち選択の入力を受け付けた情報をサーバ受信手段３１に送信し、学習手段３３は、サーバ受信手段３１が受信したこの情報を学習データとして追加学習し、学習手段３３による回答情報の生成の精度向上に資することができる。

【0060】

図１に戻り、記憶手段３４は、学習手段３３が生成した回答情報や、回答情報と分類タグとを関連付けて記憶している。また、記憶手段３４は、学習手段３３による学習の過程で文章を構成する単語に特徴量があれば、特徴量を記憶している。特徴量は、たとえば、回答情報の候補が表示される際にキーセンテンスとなっている頻度の高い単語を複数組み合わせ、この組合せをベクトル化した値を回答情報の候補として定義し、質問情報に含まれる単語が、その定義した組合せのベクトル化した値に含まれ、かつ、頻出される組合せとして近いものをランク付けする。なお、キーセンテンスは、学習手段３３の学習により、抽出される。

【0061】

記憶手段３４は、第二表示手段２９が表示した複数の回答情報として文字情報と画像情報との組合せのうち、入力手段２６がユーザから選択の入力を受け付けたものがあるときは、端末送信手段２７から、その選択された回答情報に関する情報を受信し、質問情報に含まれる単語と、回答情報に含まれる単語との組合せに対して学習手段３３が付与したポイントを記憶している。ユーザが選択した回答情報と、質問情報に対する回答との組合せは回答として確からしいと判定されるため、記憶手段３４は、質問情報と、ユーザが選択した回答情報と、ポイントと、特徴量のランクとを関連付けて記憶する。記憶手段３４が記憶しているこれらの情報によって、第二表示手段２９は、複数の回答情報としての画像情報及び／又は文字情報の表示順位を決定してもよい。

【0062】

サーバ送信手段３５は、学習手段３３が生成した複数の回答情報を端末２ｂに送信する。サーバ送信手段３５は、複数の回答情報として画像情報及び文字情報を送信し、第二表示手段２９に画像情報及び文字情報を表示させるようにしてもよい。また、サーバ送信手段３５は、後述する分析手段３６が分析した回答情報に関する情報を端末２ａに送信する。

【0063】

分析手段３６は、サーバ受信手段３１が受信した質問情報や学習手段３３が生成した回答情報、回答情報の精度、チャットボットシステム１の利用状況などを分析する。たとえば、分析手段３６は、質問情報に含まれる単語で頻出しているものがあれば集計したり、辞書情報記憶手段３２に記憶されていない辞書情報を分析することによって、辞書情報記憶手段３２に記憶させる単語を抽出したり、再学習の要点を提案する。

【0064】

ネットワーク４は、端末２とサーバ３とを無線接続する通信媒体である。ネットワーク４は、端末２がサーバ３との間で各種の情報を交信できるものであれば、どのような通信形式や通信媒体であってもよい。

【0065】

図６は、この発明の実施の形態に係るチャットボットに関する学習済みモデルが生成された後に、質問情報の受信から回答情報の生成までのフローチャートを示す図である。

【0066】

サーバ受信部３１が質問情報を受信すると、学習手段３３は、文章を構成する単語のベクトルを取得する（ステップＳ６０１）。単語のベクトルを取得するために、たとえば、ｔｆ－ｉｄｆベクトル化（ＴｆｉｄｆＶｅｃｔｏｒｉｚｅｒ）を用いて、質問情報を構成する単語をベクトル化する。なお、上記と同様、単語をベクトル化する方法として、ＢａｇＯｆＷｏｒｄｓやＷｏｒｄ２Ｖｅｃ、Ｄｏｃ２Ｖｅｃなどが用いられてもよい。

【0067】

学習手段３３は、記憶手段３４に記憶されている単語の特徴量を参照して、質問情報を構成する、ベクトル化された単語に特徴量が含まれているかどうか、判定をする（ステップＳ６０２）。

【0068】

単語に特徴量が含まれていると判定されたときは（ステップＳ６０２：Ｙｅｓ）、学習手段３３は、記憶手段３４に記憶されている特徴量のランクに応じて、回答情報の候補を抽出し、その候補に検索結果の順位付けをする（ステップＳ６０３）。

【0069】

学習手段３３によってベクトル化された単語に特徴量が含まれていないと判定されたとき（ステップＳ６０２：Ｎｏ）、及び学習手段３３が記憶手段３４に記憶されている特徴量のランクに応じて、回答情報の候補を抽出し、その候補に検索結果の順位付けをしたときは（Ｓ６０３）、学習手段３３は、さらに、ベクトル化された質問情報と近似率の高い回答情報の候補を取得する（ステップＳ６０４）。近似率の高い回答情報とは、ベクトル化された質問情報と、学習手段３３による学習の過程でベクトル化された単語と、ベクトル化された文章との距離が近いことをいう。学習手段３３は、ベクトル化された質問情報が指す場所に近い回答情報の候補を取得するために、たとえば、コサイン類似度を用いて、近似率を計算し、回答情報の候補を取得する。

【0070】

学習手段３３は、分類タグの指定があるかどうか、判定をする（ステップＳ６０５）。分類タグとは、上記のように、たとえば、社内向けのチャットボットシステム１であれば、「人事について」、「Ｗｅｂｍｔｇについて」、「ＰＣ操作方法について」などである。分類タグの指定があるときは（ステップＳ６０５：Ｙｅｓ）、指定された分類タグに従って、学習手段３３は、回答情報の候補を絞り込む（ステップＳ６０６）。

【0071】

分類タグの指定がないとき（ステップＳ６０５：Ｎｏ）、及び指定された分類タグによって回答情報の候補を絞り込んだときは（ステップＳ６０６）、学習手段３３は、ベクトル化された質問情報を構成する単語にポイントがあるかどうか、そのポイントの加算があるかどうか、判定する（ステップＳ６０７）。ポイントとは、上記のように、記憶手段３４が記憶している、関連性が高い、質問情報に含まれる単語と回答情報の候補に含まれる単語との組合せに対するポイントである。

【0072】

学習手段３３は、ポイントがあると判定したときは（ステップＳ６０７：Ｙｅｓ）、記憶手段３４が記憶しているポイントを参照して、ポイントの大きさによって、ポイントを加算し、回答情報の候補をさらに絞り込む（ステップＳ６０８）。

【0073】

学習手段３３が単語に応じたポイントがないと判定したとき（ステップＳ６０７：Ｎｏ）、及び学習手段３３がポイントによって回答情報の候補を絞り込んだときは（ステップＳ６０８）、サーバ受信手段が受信した質問情報に応じた、学習手段による回答情報の生成が完了する（ステップＳ６０９）。

【0074】

サーバ送信手段３５は、学習手段３３が生成した複数の回答情報を端末２ｂの端末受信手段２８に送信する（ステップＳ６１０）。

【0075】

第二表示手段２９は、サーバ送信手段３５から送信された複数の回答情報として画像情報及び文字情報を表示する。第二表示手段２９が表示した複数の回答情報としての画像情報及び文字情報のうち、入力手段２６がユーザによって質問された内容に応じた回答の選択の入力を受け付ける（ステップＳ６１１）。

【0076】

端末送信手段２７は、入力手段２６がユーザによって選択の入力を受け付けた回答情報があるときは、その回答情報に関する情報をサーバ受信手段３１に送信する（ステップＳ６１２）。

【0077】

学習手段３３は、サーバ受信手段３１が受信した、入力手段２６がユーザによって選択の入力を受け付けた回答情報に関する情報に対して、ポイントを加算して、上記のように、記憶手段３４によって関連付けて記憶される（ステップＳ６１３）。記憶手段３４によって記憶されたポイントは、上記のステップＳ６０７にあるとおり、次回以降の質問情報に対する回答情報を生成する過程で、回答精度を高めるために参照される。

【0078】

以上、上記実施の形態に係るサーバ３によれば、短期間で、かつ、精度の高いチャットボットシステム１を提供することができる。

【0079】

上記実施の形態に係るサーバ３によれば、回答情報として画像情報及び／又は文字情報を表示させることによって、視認性が優れているので、ユーザにとって必要と思われる情報を選択しやすくすることができる。

【0080】

上記実施の形態に係るサーバ３によれば、表示された回答情報のうち選択の入力を受け付けた回答情報に関する情報を学習データとしてさらに学習するため、より精度の高いチャットボットを生成することができる。

【0081】

上記実施の形態に係るサーバ３によれば、学習手段は、受信手段が受信した画像情報及び／又は文字情報に関する情報に応じてポイントを付与し、該ポイントに応じて回答情報として画像情報及び／又は文字情報の表示順位が決定されるので、チャットボットシステム１を使用し続けることによって、ユーザが求めている回答が表示される確度が高くなり、さらなるユーザの利便性の向上に資することができる。

【0082】

上記実施の形態に係るサーバ３によれば、ベクトルの類似度が計算されることによって、ユーザが求めている回答と同一又は回答に近いものを類似度に従って表示させることができるので、質問情報に対する回答情報の生成の精度を高くすることができる。

【0083】

上記実施の形態に係るサーバ３によれば、ベクトルの類似度に加えて、学習データとしての文章に含まれる特徴量と、質問情報に含まれる特徴量とに基づいて、類似度の計算をするため、質問情報に対する回答情報の生成の精度をさらに高くすることができる。

【0084】

上記実施の形態に係るサーバ３によれば、マニュアルやＦＡＱが更新された場合に、所定の入力を受け付けることによってチャットボットを更新することができるため、担当者の不在や情報の未蓄積などを理由としてチャットボットを更新することができなくなるという事態を避けることができ、チャットボットシステム１を管理するサーバ３の維持管理のためのメンテナンスの負担の軽減を図ることができる。

【0085】

上記実施の形態は本発明の例示であり、本発明が上記実施の形態のみに限定されることを意味するものではないことは、いうまでもない。

【0086】

たとえば、上記実施の形態に係るサーバ３がサーバ送信手段３１と、辞書情報記憶手段３２と、学習手段３３と、記憶手段３４と、サーバ受信手段３５と、分析手段３６と、を備えているが、これらの機能を複数のサーバに分散させて備えさせても良いし、これらの機能の一部を端末２に備えさせても良い。

【0087】

チャットボットシステム１は、ドキュメントの検索のためにも用いることができる。たとえば、ＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ）内で検索を行ったり、ファイルサーバーで検索を行ったり、他のシステムに登録されている文章から検索を行うなど、検索のための様々な場面で利用可能である。

【0088】

チャットボットシステム１に用いられる学習データの言語は日本語に限られない。すなわち、公知の翻訳技術を用いて、学習データとして外国語の文章を学習させることによって、外国語に対応したチャットボットに関する学習済みモデルを作成してもよい。

【符号の説明】

【0089】

１・・・チャットボットシステム
２・・・端末
３・・・サーバ
４・・・ネットワーク
２１・・・学習指示手段
２２・・・送受信手段
２３・・・第一表示手段
２６・・・入力手段
２７・・・端末送信手段
２８・・・端末受信手段
２９・・・第二表示手段
３１・・・サーバ受信手段
３２・・・辞書情報記憶手段
３３・・・学習手段
３４・・・記憶手段
３５・・・サーバ送信手段
３６・・・分析手段

【図1】