(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-09-05
(45)【発行日】2022-09-13
(54)【発明の名称】質問文生成装置、質問文生成方法、質問文生成プログラム
(51)【国際特許分類】
G06F 40/56 20200101AFI20220906BHJP
G06F 16/90 20190101ALI20220906BHJP
G06F 40/216 20200101ALI20220906BHJP
G06F 40/151 20200101ALI20220906BHJP
G06F 16/43 20190101ALI20220906BHJP
【FI】
G06F40/56
G06F16/90 100
G06F40/216
G06F40/151
G06F16/43
(21)【出願番号】P 2022028009
(22)【出願日】2022-02-25
【審査請求日】2022-03-10
【早期審査対象出願】
(73)【特許権者】
【識別番号】507228172
【氏名又は名称】株式会社JSOL
(74)【代理人】
【識別番号】110002871
【氏名又は名称】弁理士法人坂本国際特許商標事務所
(72)【発明者】
【氏名】柳沢 洋
(72)【発明者】
【氏名】井ノ口 恵美
(72)【発明者】
【氏名】清宮 晨博
(72)【発明者】
【氏名】小林 亮太
(72)【発明者】
【氏名】長谷川 洵
(72)【発明者】
【氏名】森澤 育美
(72)【発明者】
【氏名】竹原 沙季
(72)【発明者】
【氏名】生田目 祐也
【審査官】木村 大吾
(56)【参考文献】
【文献】特開2021-108033(JP,A)
【文献】特開2020-190970(JP,A)
【文献】特開2017-037588(JP,A)
【文献】特開2021-051567(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
質問文を取得する質問文取得部と、
取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成部と、を備え
、
前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、
前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、質問文生成装置。
【請求項2】
前記機械学習モデルは、単語間の類似度を数値化可能であり、
前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、請求項1に記載の質問文生成装置。
【請求項3】
前記機械学習モデルは、単語間の類似度と、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度と、を数値化可能であり、
前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換える処理と、前記取得した質問文の単語又はフレーズの前または後ろの単語又はフレーズを前記周辺出現度の高い単語及びフレーズに置き換える処理と、を重層的に行うことで、前記取得した質問文とは異なる新たな質問文を生成する、請求項
1又は2に記載の質問文生成装置。
【請求項4】
既存の質問文が登録される質問文登録部と、
前記質問文生成部が生成した新たな質問文と前記質問文登録部に登録された質問文との類似度を算出する質問妥当性確認部と、を更に備える、請求項
1~3のいずれか1項に記載の質問文生成装置。
【請求項5】
前記取得した質問文には、チャットボットのユーザ会話ログ、登録済FAQ、ホームページ上に掲載している「よくあるご質問」
又は「FAQ」の内容、電話
、メール
又は文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録及びテスト質問文のうち少なくともいずれか1つが含まれる、請求項
1~4のいずれか1項に記載の質問文生成装置。
【請求項6】
コンピュータが、質問文を取得する質問文取得ステップと、
前記コンピュータが、前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成ステップと、を備え
、
前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、
前記質問文生成ステップは、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、質問文生成方法。
【請求項7】
質問文を取得し、
前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する
処理をコンピュータに実行させ、
前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、
前記取得した質問文とは異なる新たな質問文を生成する処理は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、質問文生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、質問文生成装置、質問文生成方法、質問文生成プログラムに関する。
【背景技術】
【0002】
質問文と回答文との組合せからなる多数の登録データ(以下、FAQという)を備え、ユーザからの質問文に対して、対応する回答文を自動的に返す技術(以下、チャットボットという)が知られている(例えば、特許文献1参照)。チャットボットを運用していく場合、追加や変更をしたFAQへの質問文に対してチャットボットが正しい回答文を返せるかどうか(以下、回答精度という)の確認と、回答文が芳しくない場合の回答精度向上のためのチューニングが有用である。
【0003】
このためには、チャットボットの運用に携わるテスト実施者(以下、テスト実施者)が、チャットボットの回答精度を確認するためのテスト質問文を作成する必要がある。そして、このテスト質問文がどれだけ実際のチャットボット利用者の質問を想定した質問文になっているかが重要となる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、テスト質問文の作成は、特有の思考特性や熟練度を要する負荷の高い作業である。また、テスト実施者の思考特性や熟練度によっては、作成したテスト質問文が似たような文章ばかりになってしまい、バリエーション豊富なテスト質問文を作成できない場合がある。このような場合は、チャットボットの回答精度の確認やチューニングが不十分なものになってしまう可能性がある。
【0006】
そこで、本開示は、チャットボットのテストなどに用いる質問文を効率良く生成できる質問文生成装置、質問文生成方法、質問文生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
1つの側面では、以下のような解決手段を提供する。
(1)質問文を取得する質問文取得部と、取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成部と、を備えることを特徴とする。
(2)上記(1)の構成において、前記機械学習モデルは、単語間の類似度を数値化可能であり、前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換えることで、前記取得した質問文とは異なる新たな質問文を生成することを特徴とする。
(3)上記(1)又は(2)の構成において、前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成することを特徴とする。
(4)上記(1)~(3)のいずれかの構成において、前記機械学習モデルは、単語間の類似度と、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度と、を数値化可能であり、前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換える処理と、前記取得した質問文の単語又はフレーズの前または後ろの単語又はフレーズを前記周辺出現度の高い単語及びフレーズに置き換える処理と、を重層的に行うことで、前記取得した質問文とは異なる新たな質問文を生成することを特徴とする。
(5)上記(1)~(4)のいずれかの構成において、既存の質問文が登録される質問文登録部と、前記質問文生成部が生成した新たな質問文と前記質問文登録部に登録された質問文との類似度を算出する質問妥当性確認部と、を更に備えることを特徴とする。
(6)上記(1)~(5)のいずれかの構成において、前記取得した質問文には、チャットボットのユーザ会話ログ、登録済FAQ、ホームページ上に掲載している「よくあるご質問」や「FAQ」の内容、電話やメール・文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録及びテスト質問文のうち少なくともいずれか1つが含まれることを特徴とする。
(7)質問文を取得する質問文取得ステップと、前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成ステップと、を備えることを特徴とする。
(8)質問文を取得し、前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する処理をコンピュータに実行させることを特徴とする。
【発明の効果】
【0008】
本開示によれば、チャットボットのテストなどに用いる質問文を効率良く生成することが可能となる。
【図面の簡単な説明】
【0009】
【
図1】質問文生成装置の機能構成及び処理の流れを示すブロック図である。
【
図2】ユーザ会話ログ、登録済FAQ、分かち書きデータのデータレイアウトを示す図である。
【
図3】単語類似度、質問文、質問類似度のデータレイアウトを示す図である。
【
図4】単語類似度算出モデル生成器の処理を示す図である。
【
図10】質問文妥当性確認器の処理を示す図である。
【発明を実施するための形態】
【0010】
以下、添付図面を参照しながら各実施例について詳細に説明する。
【0011】
(質問文生成装置)
質問文生成装置100は、チャットボットのテストに用いる質問文を生成する。本実施形態の質問文生成装置100は、
図1に示すように、コンピュータなどのハードウェアと、質問文生成プログラムなどのソフトウェアとの協働により実現される機能構成を備える。この機能構成には、分かち書き器1、単語類似度算出モデル生成器2、単語類似度算出器3、質問文生成器4(質問文取得部、質問文生成部)、質問文妥当性確認器5(質問文妥当性確認部)などが含まれる。また、質問文生成器4には、サブの機能構成として、類似単語抽出器41、入力文抽出器42、質問文増幅器43などが含まれる。
【0012】
また、質問文生成装置100の記憶部6には、質問文の生成に使用するデータやモデルが記憶される。このデータやモデルには、入力質問文61、分かち書きデータ63、単語類似度64、閾値65、質問文66、質問文類似度67、単語類似度算出モデル68などが含まれる。なお、本実施形態の入力質問文61には、後述するユーザ会話ログ611、登録済FAQ612、テスト質問文613などが含まれるが、それ以外に、ホームページ上に掲載している「よくあるご質問」や「FAQ」の内容、電話やメール・文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録、テスト実施者が新たに考えた質問文なども含めることができる。
【0013】
(質問文生成装置のデータ及びモデル)
ユーザ会話ログ611は、チャットボットを利用するユーザが問合せをしてきた際の会話(質問であるユーザ会話と回答であるボット会話とを含む)の記録データである。ユーザ会話ログ611は、例えば、
図2の上段に示すようなユーザ会話ログテーブルに格納されている。一つのユーザ会話ログ611(一つのレコード)には、ユーザ会話ログ611を特定するためのユーザ会話ログIDと、ユーザの質問内容であるユーザ会話データと、質問に対する回答内容であるボット会話データと、ユーザ会話ログ611の作成日時データと、が含まれる。
【0014】
登録済FAQ612は、あらかじめチャットボットに登録されている質問文と回答文の組合せデータである。登録済FAQ612は、例えば、
図2の中段に示すような登録済FAQテーブル(質問文登録部)に格納されている。一つの登録済FAQ612には、登録済FAQ612を特定するための登録済FAQIDと、あらかじめ作成された質問文データと、質問文データに対応してあらかじめ作成された回答文データと、登録済FAQ612の作成日時データと、が含まれる。なお、テスト質問文613は、質問文生成装置100によって生成された質問文データ、テスト実施者が作成した質問文データ、テストに使用した質問文データなどを含めることができる。そのデータ構造は、後述する質問文66と同様なので、詳細な説明は省略する。
【0015】
分かち書きデータ63は、入力質問文61のうち質問部分を対象とし、単語間にスペース等を入れて分かち書きし、各単語に品詞を付けたデータである。例えば、「ATM で 振込 を したい 。」のように分かち書きした後、「ATM:名詞、で:助詞、振込:名詞、を:助詞、したい:動詞(活用形)」のように各単語に品詞が付与される。分かち書きデータ63は、例えば、
図2の下段に示すような分かち書きデータテーブルに格納されている。一つの分かち書きデータ63には、分かち書きデータ63を特定するための分かち書きデータIDと、元データを特定するための元データIDと、元データを分かち書きした分かち書き文データと、分かち書きデータ63の作成日時データと、が含まれる。この分ち書きデータ63には、過去に実施した際に生成されたデータも含まれており、新規の単語が追加されていく。
【0016】
単語類似度算出モデル68は、分かち書きデータ63を利用して、各単語間の類似度と、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度と、を数値化する機械学習モデルである。ここでフレーズとは複数の単語が連なって構成される単語群をいう。
【0017】
単語類似度64は、分かち書きデータ63内の各単語間の類似度(どの程度似ているかを示す数値)を示すデータである。単語類似度64は、例えば、
図3の上段に示すような単語類似度テーブルに格納されている。一つの単語類似度64には、単語類似度64を特定するための単語類似度IDと、単語データと、類似単語データと、単語データと類似単語データの類似度を示す類似度データと、単語類似度64の作成日時データと、が含まれる。
【0018】
閾値65は、質問文生成器4による質問文の生成において類似度がどの程度の単語を対象とするかを設定する数値である。
【0019】
質問文66は、質問文生成器4によって生成された質問文データである。質問文66は、例えば、
図3の中段に示すような質問文テーブルに格納されている。一つの質問文66には、質問文66を特定するための質問文IDと、生成した質問文データと、質問文66の作成日時データと、が含まれる。
【0020】
質問文類似度67は、生成された質問文データと登録済FAQ612との類似度を示すデータである。質問文類似度67は、例えば、
図3の下段に示すような質問文類似度テーブルに格納されている。一つの質問文類似度67(一つのレコード)には、生成した質問文66を特定するための質問文IDと、類似する登録済FAQ612を特定するための登録済FAQIDと、両者の類似度を示す類似度データと、質問文類似度67の作成日時データと、が含まれる。なお、質問文IDと類似する登録済FAQIDは、多対多で対応しており、複数の類似する登録済FAQIDと対応する質問文IDについては、複数のレコードが生成される。
【0021】
(質問文生成装置の機能構成)
つぎに、質問文生成装置100の各機能構成について、
図1及び
図4~
図10を参照して説明する。
【0022】
分かち書き器1は、入力質問文61のうち質問文の部分を分かち書きし、分かち書きデータ63として記憶部6の分かち書きデータテーブルに登録する。その際には、分かち書きした各単語の品詞も登録する(
図4参照)。
【0023】
単語類似度算出モデル生成器2は、分かち書きデータ63を利用した機械学習に基づいて、各単語間の類似度と、質問文において前後への現れやすさを示す各単語及びフレーズ間の周辺出現度とを算出可能な単語類似度算出モデル68を生成する。分かち書きデータ63を利用した機械学習において、単語の連なりの頻度、出現確率などに応じてフレーズが生成され、学習データとして利用される。フレーズは分かち書きデータ63にあらかじめ設定されていてもよい。
【0024】
例えば、
図4に示すように、単語類似度算出モデル生成器2は、分かち書きデータ63を読み込み、ベクトル変換アルゴリズムを用いて、入力された全単語及びフレーズを対象とした分散表現を構築する。ここで構築される分散表現が単語類似度算出モデル68となる。この単語類似度算出モデル68に任意の単語を与えると、その単語に似た単語(類似単語)の一覧や、質問文において前後に現れやすい単語(周辺出現単語)や前後に現れやすい単語群(フレーズ)の一覧を出力することが可能になる。
【0025】
単語類似度算出器3は、分かち書きデータ63から名詞と動詞を抽出する。その後、抽出した各単語について、単語類似度算出モデル68を利用して各単語間の類似度を数値化し、単語類似度64として記憶部6の単語類似度テーブルに登録する(
図5参照)。
【0026】
質問文生成器4の類似単語抽出器41は、単語類似度64を利用して、閾値65以上の類似度を持つ単語の組合せを抽出する(
図6参照)。対象の品詞は、名詞と動詞とする。
【0027】
質問文生成器4の入力文抽出器42は、類似単語抽出器41で抽出された単語を順次利用し、該当する単語が使われている質問文を入力質問文61の中から抽出する。なお、質問文生成器4による質問文生成方法には、類似単語抽出器41で抽出された単語を起点として新たな質問文を生成する第1質問文生成方法と、入力質問文61から順次読み込まれる質問文を起点として新たな質問文を生成する第2質問文生成方法と、が含まれる。第1質問文生成方法における入力文抽出器42は、上述のように、類似単語抽出器41で抽出された単語を順次利用し、該当する単語が使われている質問文を入力質問文61の中から抽出するが、第2質問文生成方法における入力文抽出器42は、入力質問文61から質問文を順次読み込み、類似単語抽出器41を参照しながら質問文中の単語を処理する。
【0028】
質問文生成器4の質問文増幅器43は、第1質問文生成方法の場合、入力文抽出器42で抽出された質問文の中で検索対象となった単語部分をその類似単語に置き換え(以下、置換後単語という)、新たな質問文候補とする。例えば、
図7に示すように、対象の質問文が「インターネットバンキングで振込を行いたい。」であった場合、「インターネットバンキング」の部分を類似度の高い単語である「ネットバンキング」や「パソコン」に置き換える。また、「振込」の部分を類似度の高い単語である「振込み」や「振り込み」に置き換える。
【0029】
つぎに、質問文増幅器43は、置換後単語の後続単語として現れやすい単語群候補を単語類似度算出モデル68に問合せ、返された単語群候補をつなげて新たな質問文候補を生成する。質問文増幅器43から単語類似度算出モデル68への問合せは、1単語だけではなく、返す単語数を指定して複数語群(フレーズ)を返すように指示することができる。具体的な処理としては、返す単語数を指定して問合せをするだけでなく、その単語数をランダムに変えたり、文中の単語の位置に応じて変えたりすることが考えられる。例えば、
図7に示す例では、「ネットバンキングで振込を行いたい。」という質問文からは、「ネットバンキング」の後続フレーズとして返す単語数を、質問文の後続単語数に比べて十分大きい数字(例えば7)に設定して問い合わせた結果をつなげることで、「ネットバンキングで口座を作りたい。」や「ネットバンキングが使えない。」が生成される。同様にして、「パソコンで振込を行いたい。」という質問文からは「パソコンでインターネットバンキングをしたい。」や「パソコンで口座を作りたい。」が生成される。また、「インターネットバンキングで振込みを行いたい。」という質問文からは「インターネットバンキングで振込みがしたい。」や「インターネットバンキングで振込みをやってみたい。」が生成される。
【0030】
つぎに、質問文増幅器43は、置換後単語の前述単語として現れやすい単語群候補を単語類似度算出モデル68に問合せ、返された単語群候補をつなげて新たな質問文候補を生成する。例えば、
図8に示すように、「ネットバンキングで口座を作りたい。」という質問文からは「ATMで口座を作りたい。」が生成される。また、「ネットバンキングが使えない。」という質問文からは「ペイジーが使えない。」や「パソコンが使えない。」が生成される。また、「インターネットバンキングで振込みがしたい。」という質問文からは「ATMで振込みがしたい。」、「コンビニで振込みがしたい。」、「スマホで振込みがしたい。」などが生成される。なお、
図8に示す単語類似度算出モデル68への問合せも、1単語だけではなく、複数語群(フレーズ)を返すように指定して行ったものである。
【0031】
そして、質問文増幅器43は、
図9に示すように、新たに生成された質問文候補を質問文66として記憶部6の質問文テーブルに登録する。なお、
図7及び
図8に示す例では、2単語「インターネットバンキング」、「振込」を対象として単語の置き換えを行ったが、実際の処理では、動詞部分である「行い(たい)」についても同様な置き換え処理が行われる。なお、類似単語による置換処理、後続単語(群)による置換処理、前述単語(群)による置換処理の順番や回数は、上述した一連の手順に限定されない。例えば、処理の順番や繰り返し回数を任意に組み合わせて実行することで、一つの質問文から、その中の単語を入れ替えて複数の新たな質問文を生成することが可能であり、更に生成した質問文の単語を入れ替えて新たな質問文を生成するという具合に質問文を重層的に処理し、増殖させることができる。また、質問文増幅器43は、第2質問文生成方法の場合、入力文抽出器42が順次読み込む質問文を対象とし、その質問文から単語を抽出し、抽出した単語が類似単語抽出器41にあるか否かを判定し、あった場合、その単語部分を類似単語に置き換える。以降の処理手順は、第1質問文生成方法と同様である。
【0032】
質問文妥当性確認器5は、質問文生成器4で生成された質問文候補を順次読込み、文法や文全体として意味の通った質問文かどうかを判断する。その後、問題ないと判断された質問文について、登録済FAQ612の質問文との類似度を算出する。例えば、文章全体をベクトル化して文章単位で比較できるアルゴリズムを使用して文章間の類似度を算出する。ここで算出された質問文類似度は、質問文ID及び類似する登録済FAQIDを付与した形で質問文類似度67として記憶部6の質問文類似度テーブルに登録する。なお、質問文類似度は、既存の質問文に似通っていると高い類似度が出て、似ていないほど低い数値が出る。
【0033】
また、質問文妥当性確認器5は、
図10に示すように、チャットボットのテスト実施者に対して、新たに生成した質問文を、登録済FAQ612との類似度に紐付けて提供(表示)することができる。テスト実施者は、提供された質問文の要否を確認した上で、必要な質問文を取得し、チャットボットのテストに使用することができる。
【0034】
以上のように構成された本実施形態の質問文生成装置100によれば、質問文を取得し、取得した質問文を構成する1つ以上の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文とは異なる新たな質問文を生成する質問文生成器4を備える。これにより、チャットボットのテストなどに用いる質問文を効率良く生成できる。
【0035】
また、質問文生成器4は、取得した質問文の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文の単語を類似度の高い単語に置き換える。これにより、類似度の高い単語を用いた新たな質問文を自動的に生成することが可能になる。
【0036】
また、質問文生成器4は、取得した質問文の単語又はフレーズに対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文の単語又はフレーズを周辺出現度の高い単語又はフレーズに置き換える。これにより、周辺出現度の高い単語又はフレーズを用いた新たな質問文を自動的に生成することが可能になる。
【0037】
また、質問文生成器4は、取得した質問文の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文の単語を類似度の高い単語に置き換える処理と、取得した質問文の単語又はフレーズを周辺出現度の高い単語又はフレーズに置き換える処理と、を重層的に行う。これにより、類似度が高い単語と周辺出現度の高い単語又はフレーズを複合的に用いた新たな質問文を自動的に生成することが可能になる。
【0038】
また、質問文生成装置100は、質問文生成器4が生成した新たな質問文と登録済FAQ612の質問文との類似度を算出する質問妥当性確認器5を更に備えるので、算出した類似度に基づいて、生成した新たな質問文の評価(有効性の確認など)を容易に行うことができる。
【0039】
また、質問文生成器4が取得する質問文には、チャットボットのユーザ会話ログ611、登録済FAQ612、ホームページ上に掲載している「よくあるご質問」や「FAQ」の内容、電話やメール・文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録及びテスト質問文613が含まれるので、テスト質問作成者の思考特性や熟練度に依存しない「チャットボット利用者が使ってきそうな質問文」を新たに自動でたくさん作りだせる。
【0040】
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施例の構成要素を全部又は複数を組み合わせることも可能である。
【符号の説明】
【0041】
100 質問文生成装置
1 分かち書き器
2 単語類似度算出モデル生成器
3 単語類似度算出器
4 質問文生成器
41 類似単語抽出器
42 入力文抽出器
43 質問文増幅器
5 質問文妥当性確認器
6 記憶部
61 入力質問文
611 ユーザ会話ログ
612 登録済FAQ
613 テスト質問文
63 分かち書きデータ
64 単語類似度
65 閾値
66 質問文
67 質問文類似度
68 単語類似度算出モデル
【要約】
【課題】 チャットボットのテストなどに用いる質問文を効率良く生成できる質問文生成装置、質問文生成方法、質問文生成プログラムを提供する。
【解決手段】 質問文を生成する質問文生成装置100であって、ユーザ会話ログ611、登録済FAQ612、テスト質問文613などから質問文を取得し、取得した質問文を構成する1つ以上の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文とは異なる新たな質問文を生成する。
【選択図】
図1