IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

<>
  • 特開-生成プログラム、装置、及び方法 図1
  • 特開-生成プログラム、装置、及び方法 図2
  • 特開-生成プログラム、装置、及び方法 図3
  • 特開-生成プログラム、装置、及び方法 図4
  • 特開-生成プログラム、装置、及び方法 図5
  • 特開-生成プログラム、装置、及び方法 図6
  • 特開-生成プログラム、装置、及び方法 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024034276
(43)【公開日】2024-03-13
(54)【発明の名称】生成プログラム、装置、及び方法
(51)【国際特許分類】
   G06F 16/90 20190101AFI20240306BHJP
【FI】
G06F16/90 100
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022138411
(22)【出願日】2022-08-31
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】谷 聡史
(72)【発明者】
【氏名】古谷 勇樹
(72)【発明者】
【氏名】上原 信洋
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175EA01
5B175FB01
(57)【要約】
【課題】生成される質問回答情報の質を向上させる。
【解決手段】生成装置は、文書データに含まれる連続する所定数の文の要約文を生成し、生成した要約文を回答文とし、回答文に対応する質問文を、要約文及び所定数の文の少なくとも一方に基づいて生成し、質問文と回答文とを対応付けた質問回答情報(FAQ)を生成する。
【選択図】図4
【特許請求の範囲】
【請求項1】
文書データに含まれる連続する所定数の文の要約文を生成し、
生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成し、
前記質問文と前記回答文とを対応付けた質問回答情報を生成する、
ことを含む処理をコンピュータに実行させるための生成プログラム。
【請求項2】
前記要約文を生成する処理は、所定数の文から、質問され易い内容を示す単語列として予め定めた単語列を含む要約文を生成するように予め機械学習により生成された機械学習モデルを用いることを含む請求項1に記載の生成プログラム。
【請求項3】
前記要約文を生成する処理は、前記文書データの先頭の文から順に所定数ずつに区切って前記所定数の文を抽出すること、又は、前記文書データの先頭の文から順に1文ずつずらしながら前記所定数の文を抽出することを含む請求項1又は請求項2に記載の生成プログラム。
【請求項4】
前記所定数を、2又は3とする請求項1又は請求項2に記載の生成プログラム。
【請求項5】
文書データに含まれる連続する所定数の文の要約文を生成し、
生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成し、
前記質問文と前記回答文とを対応付けた質問回答情報を生成する、
生成部を含む生成装置。
【請求項6】
文書データに含まれる連続する所定数の文の要約文を生成し、
生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成し、
前記質問文と前記回答文とを対応付けた質問回答情報を生成する、
ことを含む処理をコンピュータが実行する生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
開示の技術は、生成プログラム、生成装置、及び生成方法に関する。
【背景技術】
【0002】
例えば、従業員や顧客からの問い合わせに対する問い合わせ対応業務には、オペレータが電話、チャット、メール等で回答する有人対応と、チャットボット等による無人対応とがある。有人対応では、過去の事例が少ない内容や比較的難しい内容の問い合わせを含め、一件一件の問い合わせに対して丁寧な対応が可能であるが、受付時間に制限があるという課題がある。一方、無人対応では、システムの稼働時間にもよるが、よくある内容の問い合わせに対して、いつでも迅速な回答が可能である。したがって、有人対応と無人対応とを適切に使い分けることで、問い合わせ対応業務の効率化が推進される。
【0003】
問い合わせ対応業務において、無人対応を効率的に利用するために、チャットボット等による自動回答のためのFAQ(Frequently Asked Questions)ナレッジを作り込むことが行われている。なお、FAQナレッジとは、質問文と回答文とのペアを1件のナレッジとし、複数件のナレッジを含むデータベースである。
【0004】
FAQナレッジの生成に関する技術として、例えば、回答に関する質問を生成する際に、パッセージ中の回答範囲に含まれる単語の使用を防止する生成装置が提案されている。この装置は、文書を入力として、予め学習済みの機械学習モデルを用いて、文書中で回答となる範囲に対する質問表現を生成し、質問表現を構成する単語を文書中からコピーして生成する際に、前記範囲に含まれる単語がコピーされる確率を調整する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2020-135457号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
所定のルールに基づいて、入力された文書データから質問文と回答文とのペアを抽出する場合、生成される質問回答情報(FAQ)の質が低い場合がある。
【0007】
一つの側面として、開示の技術は、生成される質問回答情報の質を向上させることを目的とする。
【課題を解決するための手段】
【0008】
一つの態様として、開示の技術は、文書データに含まれる連続する所定数の文の要約文を生成し、生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成する。そして、開示の技術は、前記質問文と前記回答文とを対応付けた質問回答情報を生成する。
【発明の効果】
【0009】
一つの側面として、生成される質問回答情報の質を向上させることができる、という効果を有する。
【図面の簡単な説明】
【0010】
図1】本実施形態に係る生成装置の機能ブロック図である。
図2】要約文の生成の一例を説明するための図である。
図3】要約文の生成の他の例を説明するための図である
図4】FAQの生成を説明するための図である。
図5】生成装置として機能するコンピュータの概略構成を示すブロック図である。
図6】生成処理の一例を示すフローチャートである。
図7】生成されるFAQについて、比較手法と本手法との比較を示す図である。
【発明を実施するための形態】
【0011】
以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。
【0012】
図1に示すように、本実施形態に係る生成装置10には、文書データが入力される。文書データは、FAQナレッジ20を生成する対象の文書、例えば、運用マニュアル、問合せ業務のログ等のテキストデータである。生成装置10は、文書データから生成される要約文を利用して質問回答情報を生成し、FAQナレッジ20として出力する。
【0013】
生成装置10は、機能的には、要約文生成部12と、質問文生成部14と、FAQ生成部16とを含む。なお、要約文生成部12、質問文生成部14、及びFAQ生成部16は、開示の技術の「生成部」の一例である。
【0014】
要約文生成部12は、生成装置10に入力される文書データを取得し、取得した文書データに含まれる連続する所定数の文の要約文を生成する。具体的には、要約文生成部12は、文書データが示す文書を、例えば句点の位置で分割する等して、1文ずつに分割する。要約文生成部12は、図2に示すように、文書データの先頭の文から順に所定数ずつに区切って、所定数の文を抽出する。また、要約文生成部12は、図3に示すように、文書データの先頭の文から順に1文ずつずらしながら、所定数の文を抽出してもよい。図2の例では、所定数は2であり、図3の例では、所定数は3である。以下では、抽出した各所定数の文を「原文」という。
【0015】
要約文生成部12は、例えば、入力された原文の要約文を生成するように機械学習により予め生成された機械学習モデルを用いて、抽出した原文の各々についての要約文を生成する。機械学習モデルを用いた要約文の生成には、従来既知の手法を適用してよいため、詳細な説明は省略する。なお、機械学習モデルとして、入力された原文から、質問され易い内容を示す単語列として予め定めた単語列を含む要約文を生成するように予め機械学習により生成された機械学習モデルを用いてもよい。
【0016】
質問文生成部14は、図4に示すように、要約文生成部12により生成された要約文を回答文とする。また、質問文生成部14は、回答文に対応する質問文を、その回答文、すなわち要約文、及び要約文に対する原文の少なくとも一方に基づいて生成する。質問文の生成には、従来既知の手法を適用してよい。例えば、質問文生成部14は、回答文の末尾を、予め定めたルールに基づいて質問形式に変換することにより、質問文を生成する。また、例えば、質問文生成部14は、要約文に対応する原文の部分を特定し、特定した部分に含まれる重要な単語列を抽出する。そして、質問文生成部14は、抽出した単語列について、その単語列に対応する5W1H(いつ(When)、どこで(Where)、誰が(Who)、何を(What)、なぜ(Why)、どのように(How))のいずれかを質問する質問文を生成してもよい。なお、重要な単語列か否かは、予め定めた単語辞書に基づいて、原文に含まれる各単語に重み付けをするなどしておき、その重みに基づいて判定するようにしてよい。
【0017】
FAQ生成部16は、図4に示すように、回答文、すなわち、要約文生成部12で生成された要約文と、質問文生成部14で生成された質問文とを対応付けて質問回答情報(以下、「FAQ」という)を生成する。FAQ生成部16は、要約文生成部12で生成された要約文毎にFAQを生成し、生成した複数のFAQをFAQナレッジ20として出力する。
【0018】
生成装置10は、例えば図5に示すコンピュータ40で実現されてよい。コンピュータ40は、CPU(Central Processing Unit)41と、一時記憶領域としてのメモリ42と、不揮発性の記憶装置43とを備える。また、コンピュータ40は、入力装置、表示装置等の入出力装置44と、記憶媒体49に対するデータの読み込み及び書き込みを制御するR/W(Read/Write)装置45とを備える。また、コンピュータ40は、インターネット等のネットワークに接続される通信I/F(Interface)46を備える。CPU41、メモリ42、記憶装置43、入出力装置44、R/W装置45、及び通信I/F46は、バス47を介して互いに接続される。
【0019】
記憶装置43は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等である。記憶媒体としての記憶装置43には、コンピュータ40を、生成装置10として機能させるための生成プログラム50が記憶される。生成プログラム50は、要約文生成プロセス制御命令52と、質問文生成プロセス制御命令54と、FAQ生成プロセス制御命令56とを有する。
【0020】
CPU41は、生成プログラム50を記憶装置43から読み出してメモリ42に展開し、生成プログラム50が有する制御命令を順次実行する。CPU41は、要約文生成プロセス制御命令52を実行することで、図1に示す要約文生成部12として動作する。また、CPU41は、質問文生成プロセス制御命令54を実行することで、図1に示す質問文生成部14として動作する。また、CPU41は、FAQ生成プロセス制御命令56を実行することで、図1に示すFAQ生成部16として動作する。これにより、生成プログラム50を実行したコンピュータ40が、生成装置10として機能することになる。なお、プログラムを実行するCPU41はハードウェアである。
【0021】
なお、生成プログラム50により実現される機能は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等で実現されてもよい。
【0022】
次に、本実施形態に係る生成装置10の動作について説明する。生成装置10に文書データが入力され、FAQナレッジ20の生成が指示されると、生成装置10において、図6に示す生成処理が実行される。なお、生成処理は、開示の技術の生成方法の一例である。
【0023】
ステップS10で、要約文生成部12が、生成装置10に入力された文書データを取得する。次に、ステップS12で、要約文生成部12が、文書データが示す文書を、例えば句点の位置で分割する等して、1文ずつに分割する。そして、要約文生成部12が、文書データの先頭の文から順に所定数ずつに区切った所定数の文の各々、又は、文書データの先頭の文から順に1文ずつずらしながら設定した所定数の文の各々を、原文として抽出する。
【0024】
次に、ステップS14で、要約文生成部12が、例えば、入力された原文の要約文を生成するように機械学習により予め生成された機械学習モデルを用いて、抽出した原文の各々についての要約文を生成する。次に、ステップS16で、質問文生成部14が、上記ステップS14で生成された要約文を回答文とし、その回答文に対応する質問文を、その回答文である要約文、及び要約文に対する原文の少なくとも一方に基づいて生成する。
【0025】
次に、ステップS18で、FAQ生成部16が、回答文、すなわち、上記ステップS14で生成された要約文と、上記ステップS16で生成された質問文とを対応付けてFAQを生成する。次に、ステップS20で、FAQ生成部16が、生成した複数のFAQをFAQナレッジ20として出力し、生成処理は終了する。
【0026】
以上説明したように、本実施形態に係る生成装置は、文書データに含まれる連続する所定数の文を原文とし、原文に対する要約文を生成する。そして、生成装置は、生成した要約文を回答文とし、回答文に対応する質問文を、要約文及び原文の少なくとも一方に基づいて生成し、質問文と回答文とを対応付けたFAQを生成する。これにより、生成されるFAQの質を向上させることができる。
【0027】
ここで、図7に、比較手法で生成されるFAQと、本実施形態による手法(以下、「本手法」という)で生成されるFAQとの比較を示す。比較手法は、原文から要約文を生成することなく、原文からそのままFAQを生成する手法である。図7では、原文と回答文との対応箇所を、一方の原文については一重下線、他方の原文については二重下線で示している。図7の例は、連続する2つの文を原文として要約文を生成し、その要約文を回答文(A1)としている。これにより、比較手法に比べ、本手法で生成されたFAQの方が、有用な情報を有したFAQとなっている。
【0028】
また、文書データに含まれる各文には、指示語が含まれる場合があるが、その指示語が指す内容は、その指示語が含まれる文自体ではなく、その指示語が含まれる文の前後に出現する場合もある。この場合、原文からそのままFAQを生成すると、例えば、「Q:このサービスはどのようなサービスですか? A:このサービスは、モデルを再学習するサービスです。」のようなFAQが生成されることとなり、FAQとして有用な情報が欠落してしまう。一方、本手法のように、文書データに含まれる連続する所定数の文を原文とし、原文に対する要約文を生成することで、各文に含まれる指示語が指す内容を特定した要約文が生成される可能性が高まる。そして、本手法では、この要約文に基づいてFAQを生成することで、有用な情報が含まれるFAQを生成することができる。
【0029】
また、本実施形態は、文書データの先頭の文から順に所定数ずつに区切った所定数の文、又は、文書データの先頭の文から順に1文ずつずらしながら設定した所定数の文を原文とし、各原文について要約文を生成し、各要約文からFAQを生成する。これにより、文書データから網羅的に漏れなくFAQを生成することができる。また、例えば、文書データから所定のルールに基づいて質問文及び回答文を抽出するような手法に比べ、1つの文書データから生成されるFAQの量の向上を図ることができる。
【0030】
なお、原文の範囲を示す上記の所定数を多くし過ぎると、原文の範囲が広くなり過ぎ、生成された要約文において重要な情報が欠落する可能性が高まる。このような要約文からFAQを生成すると、FAQの質も低下してしまう。本実施形態では、上記の所定数を2又は3とすることで、原文に含まれる重要な情報の欠落を回避することができる。また、所定数を2又は3とすることにより、1つの文書データから生成されるFAQの量の向上も図ることができる。
【0031】
また、上記実施形態では、生成プログラムが記憶装置に予め記憶(インストール)されているが、これに限定されない。開示の技術に係るプログラムは、CD-ROM、DVD-ROM、USBメモリ等の記憶媒体に記憶された形態で提供されてもよい。
【0032】
以上の実施形態に関し、さらに以下の付記を開示する。
【0033】
(付記1)
文書データに含まれる連続する所定数の文の要約文を生成し、
生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成し、
前記質問文と前記回答文とを対応付けた質問回答情報を生成する、
ことを含む処理をコンピュータに実行させるための生成プログラム。
【0034】
(付記2)
前記要約文を生成する処理は、所定数の文から、質問され易い内容を示す単語列として予め定めた単語列を含む要約文を生成するように予め機械学習により生成された機械学習モデルを用いることを含む付記1に記載の生成プログラム。
【0035】
(付記3)
前記要約文を生成する処理は、前記文書データの先頭の文から順に所定数ずつに区切って前記所定数の文を抽出すること、又は、前記文書データの先頭の文から順に1文ずつずらしながら前記所定数の文を抽出することを含む付記1又は付記2に記載の生成プログラム。
【0036】
(付記4)
前記所定数を、2又は3とする付記1~付記3のいずれか1項に記載の生成プログラム。
【0037】
(付記5)
文書データに含まれる連続する所定数の文の要約文を生成し、
生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成し、
前記質問文と前記回答文とを対応付けた質問回答情報を生成する、
生成部を含む生成装置。
【0038】
(付記6)
前記要約文を生成する処理は、所定数の文から、質問され易い内容を示す単語列として予め定めた単語列を含む要約文を生成するように予め機械学習により生成された機械学習モデルを用いることを含む付記5に記載の生成装置。
【0039】
(付記7)
前記要約文を生成する処理は、前記文書データの先頭の文から順に所定数ずつに区切って前記所定数の文を抽出すること、又は、前記文書データの先頭の文から順に1文ずつずらしながら前記所定数の文を抽出することを含む付記5又は付記6に記載の生成装置。
【0040】
(付記8)
前記所定数を、2又は3とする付記5~付記7のいずれか1項に記載の生成装置。
【0041】
(付記9)
文書データに含まれる連続する所定数の文の要約文を生成し、
生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成し、
前記質問文と前記回答文とを対応付けた質問回答情報を生成する、
ことを含む処理をコンピュータが実行する生成方法。
【0042】
(付記10)
前記要約文を生成する処理は、所定数の文から、質問され易い内容を示す単語列として予め定めた単語列を含む要約文を生成するように予め機械学習により生成された機械学習モデルを用いることを含む付記9に記載の生成方法。
【0043】
(付記11)
前記要約文を生成する処理は、前記文書データの先頭の文から順に所定数ずつに区切って前記所定数の文を抽出すること、又は、前記文書データの先頭の文から順に1文ずつずらしながら前記所定数の文を抽出することを含む付記9又は付記10に記載の生成方法。
【0044】
(付記12)
前記所定数を、2又は3とする付記9~付記11のいずれか1項に記載の生成方法。
【0045】
(付記13)
文書データに含まれる連続する所定数の文の要約文を生成し、
生成した前記要約文を回答文とし、前記回答文に対応する質問文を、前記要約文及び前記所定数の文の少なくとも一方に基づいて生成し、
前記質問文と前記回答文とを対応付けた質問回答情報を生成する、
ことを含む処理をコンピュータに実行させるための生成プログラムを記憶した非一時的記憶媒体。
【符号の説明】
【0046】
10 生成装置
12 要約文生成部
14 質問文生成部
16 FAQ生成部
20 FAQナレッジ
40 コンピュータ
41 CPU
42 メモリ
43 記憶装置
44 入出力装置
45 R/W装置
46 通信I/F
47 バス
49 記憶媒体
50 生成プログラム
52 要約文生成プロセス制御命令
54 質問文生成プロセス制御命令
56 FAQ生成プロセス制御命令
図1
図2
図3
図4
図5
図6
図7