(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-24
(45)【発行日】2023-05-02
(54)【発明の名称】回答装置、回答方法、回答プログラム
(51)【国際特許分類】
G06F 16/90 20190101AFI20230425BHJP
G06F 40/58 20200101ALI20230425BHJP
【FI】
G06F16/90 100
G06F40/58
(21)【出願番号】P 2021024902
(22)【出願日】2021-02-19
【審査請求日】2021-12-17
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】日暮 立
(72)【発明者】
【氏名】清水 徹
(72)【発明者】
【氏名】小林 隼人
(72)【発明者】
【氏名】増山 毅司
【審査官】原 秀人
(56)【参考文献】
【文献】特開2020-126392(JP,A)
【文献】特開2021-012646(JP,A)
【文献】特開2006-252381(JP,A)
【文献】特開2017-037588(JP,A)
【文献】国際公開第2018/186445(WO,A1)
【文献】米国特許出願公開第2021/0042388(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 40/20-40/58
(57)【特許請求の範囲】
【請求項1】
利用者が入力した質問文を含む情報を解析して、利用者が求める回答文の条件を設定する解析部と、
前記解析部により設定された利用者が求める回答文の条件に基づいて回答文を選定する選定部と、
利用者が入力した質問文に対して、他の利用者が回答文を入力する際に、利用者が求める情報の入力を促す回答補助部と、
を備える回答装置。
【請求項2】
前記選定部が選定した回答文に対して、文体の変換を行う変換部と、を備える、
請求項1に記載の回答装置。
【請求項3】
利用者が入力した質問文を含む情報に基づいて、利用者の好みの文体を推定する推定部と、
を備え、
前記変換部は、前記選定部が選定した回答文に対して、前記推定部が推定した利用者の好みの文体に変換する
請求項2に記載の回答装置。
【請求項4】
質問文の文体の特徴と、利用者が満足した回答文の文体の特徴との関係を学習し、文体学習モデルを生成する文体学習部と、を備え、
前記変換部は、前記選定部が選定した回答文に対して、前記文体学習部を用いて利用者が満足した回答文の文体に変換する
請求項2に記載の回答装置。
【請求項5】
質問文の特徴と回答文の特徴との関係を学習し、回答学習モデルを生成する回答学習部と、を備え、
前記選定部は、前記回答学習部が生成した回答学習モデルを用いて出力された回答文を選定対象に含む、
請求項1から請求項4のいずれか1項に記載の回答装置。
【請求項6】
前記解析部が設定した利用者が求める回答文の条件と、前記選定部が選定した回答文との関係に基づいて、前記選定部が選定した回答文が、利用者が求める回答文にどの程度近いかを示す要求充足度を計算する計算部と、を備える、
請求項1から請求項
5のいずれか1項に記載の回答装置。
【請求項7】
コンピュータが
実行する
回答方法であって、
利用者が入力した質問文を含む情報
を解析して
、利用者が求める回答文の条件を設定する
解析工程と、
前記解析工程により設定された利用者が求める回答文の条件に基づいて回答文を選定する
選定工程と、
利用者が入力した
質問文に対して、他の利用者が回答文
を入力する際に
、利用者が求める情報の
入力を
促す回答補助工程と、
を含む回答方法。
【請求項8】
利用者が入力した質問文を含む情報
を解析して
、利用者が求める回答文の条件を設定する
解析手順と、
前記解析手順により設定された利用者が求める回答文の条件に基づいて回答文を選定する
選定手順と、
利用者が入力した
質問文に対して、他の利用者が回答文
を入力する際に
、利用者が求める情報の
入力を
促す回答補助手順と、
をコンピュータに実行させる回答プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、回答装置、回答方法、回答プログラムに関する。
【背景技術】
【0002】
様々な情報を利用者に提供する情報提供技術が知られている。このような情報提供技術の一例として、情報提供先となる利用者の質問に応じて、提供対象となる情報を選択する技術が知られている。例えば、所謂Q&A(Question & Answering)サイトにおいて、質問者の質問に応じて理想的な回答を選定し、選定した回答を質問者に通知する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、質問に対して固定された回答が質問者にとって最適とは限らない。例えば、質問に対する回答が質問に対して回答しているものの丁寧な表現ではなかった場合、質問者が気分を害する恐れがある。
【0005】
本発明は上記課題を鑑み、利用者に対してより適切な情報を提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本開示に係る回答装置は、利用者が入力した質問文を含む情報を解析して、利用者が求める回答文の条件を設定する解析部と、前記解析部により設定された利用者が求める回答文の条件に基づいて回答文を選定する選定部と、を備える。
【発明の効果】
【0007】
実施形態の一態様によれば、利用者に対してより適切な情報を提供することができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、第1実施形態に係る情報提供装置の一例を示す図である。
【
図2】
図2は、第1実施形態に係る情報提供装置の構成例を示す図である。
【
図3】
図3は、第1実施形態に係る利用者データベースに登録される情報の一例を示す図である。
【
図4】
図4は、第1実施形態に係るQ&Aデータベースに登録される情報の一例を示す図である。
【
図5】
図5は、第1実施形態に係る回答処理の流れの一例を示す図である。
【
図6】
図6は、ハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る回答装置、回答方法および回答プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る回答装置、回答方法および回答プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。
【0010】
[第1実施形態]
〔1-1.情報提供装置の一例について〕
まず、
図1を用いて、実施形態に係る回答装置の一例である情報提供装置10の一例について説明する。なお、以下の説明では、情報提供装置10が実行する回答処理の一例として、所謂Q&Aサイトに関するサービスにおいて実行される回答処理の一例について説明するが、実施形態はこれに限定されるものではない。後述する説明で明らかとなるように、回答処理は、Q&Aサイトに関するサービス以外にも、各種のコミュニティサイト等、利用者に対して提供される任意のサービスに対して適用可能である。
【0011】
また、以下の説明では、Q&Aサイトに対して質問となる文章等を投稿する利用者を質問者と記載し、質問に対して回答となる文章等を投稿する利用者を回答者と記載する。また、以下の説明では、質問となる文章や回答となる文章等、各利用者から受け付けた情報を、各利用者から投稿された投稿情報と総称する場合がある。
【0012】
図1は、第1実施形態に係る情報提供装置の一例を示す図である。
図1に示す情報提供装置10は、回答処理を行う情報提供装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報提供装置10は、4G(Generation)、5G、LTE(Long Term Evolution)、Wifi(登録商標)若しくは無線LAN(Local Area Network)等といった各種の無線通信網若しくは各種の有線通信網といったネットワークN(例えば、
図2参照)を介して、各利用者が使用する端末装置QT1、RT1からRT3との間で通信を行う。
【0013】
端末装置QT1、RT1からRT3(以下、「端末装置T」と総称する場合がある。)は、例えばPC(Personal Computer)、サーバ装置、スマートテレビジョン、スマートフォン若しくはタブレット等といったスマートデバイス等により実現され、ネットワークNを介して、情報提供装置10との間で通信を行うことができるものであってよい。また、端末装置Tは、液晶ディスプレイ等の画面であって、タッチパネルの機能を有する画面を有し、利用者から指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、情報提供装置10から配信されるコンテンツに対する各種の操作を受け付け可能な機能を有していてもよい。
【0014】
なお、
図1に示す例では、端末装置QT1は、利用者Q1により利用される端末装置であり、端末装置RT1からRT3は、それぞれ異なる回答者R1からR3により利用される端末であるものとする。また、
図1に示す例では、一人の利用者Q1および3人の回答者R1からR3を記載したが、実施形態は、これに限定されるものではない。情報提供装置10は、任意の数の質問者から任意の数の質問を受け付けてよく、任意の数の回答者から任意の数の回答を受け付けてよい。
【0015】
例えば、
図1に示す例では、情報提供装置10は、質問文と回答文のデータセットを用いて、質問文の特徴と回答文の特徴との関係を学習し、学習モデルを生成する(ステップS1)。情報提供装置10は、利用者から質問文の入力を受け付ける(ステップS2)。情報提供装置10は、利用者から受け付けた質問文から質問者が求める回答文の条件を設定する(ステップS3)。情報提供装置10は、他の利用者から回答文の入力を受け付ける(ステップS4)。情報提供装置10は、学習モデルに質問者の質問文を入力し、回答文の出力を得る。(ステップS5)。情報提供装置10は、質問者の求める回答文の条件に基づいて、回答文を選定する(ステップS6)。情報提供装置10は、選定された回答文の文体を変換する(ステップS7)。情報提供装置10は、文体が変換された回答文を利用者の端末装置QT1に表示させる(ステップS8)。
【0016】
〔1-2.回答処理について〕
ここで、Q&Aサイトにおいては、各質問に対する回答の質を向上させることによって、新たな質問の投稿を促すことができる結果、質問や回答の閲覧数を向上させ、Q&Aサイト全体の活性化を図ることができると考えられる。
【0017】
そこで、情報提供装置10は、利用者から質問文を含む情報を取得し、利用者が入力した質問文を含む情報を解析して、利用者が求める回答文の条件を設定する。利用者が求める回答文の条件が設定されたら、利用者が求める回答文の条件に基づいて回答文を選定する。
【0018】
例えば、利用者Q1が質問文として、質問文A「ユニクロマスク購入出来ました。念願のユニクロマスク購入出来ました。洗えて3枚入り。初回購入者(ネット)のみ送料無料はお得?」という質問を、端末装置QT1に入力した場合の処理について説明する。この場合、情報提供装置10は、端末装置QT1から質問文Aの情報を取得し、質問文Aを解析して、利用者Q1が求める回答文の条件を設定する。具体的には、例えば、情報提供装置10は、質問文Aから、利用者Q1が求める回答文の条件は、条件1「ユニクロマスクのネットでの初回購入者のみが送料無料はお得か否かについての情報を含むこと」と設定する。また、情報提供装置10は、条件2「他のネット通信販売サイトで、ユニクロマスクを購入した場合の送料についての情報が含まれること」を追加条件として設定してもよい。情報提供装置10は、利用者Q1が求める回答文の条件として、条件1、条件2が設定されたら、Q&Aサイトの利用者が過去に投稿した回答文を集約した情報を示す回答文集合の中から、条件1、条件2を充足する回答文を選定する。情報提供装置10は、条件1、条件2を充足する回答文が選定されたら、選定された回答文を端末装置QT1に表示する為のコンテンツ情報を生成し、端末装置QT1に送信する。
【0019】
これにより、質問文を入力した利用者が質問を入力することで得たいと考えた情報を、利用者が取得する可能性を上げることが可能となる為、利用者のQ&Aサイトに対する信頼度が高まり、利用者の質問頻度を向上させることができる。その結果、Q&Aサイトを活性化させることができる。
【0020】
〔1-3.回答文の文体の変換について〕
一方で、質問に対する回答の内容が正しいとしても、回答文の文体によっては、質問者が気分を害する結果、質問者の質問頻度を低下させ、Q&Aサイトの活性化を図ることができなくなる。
【0021】
そこで、情報提供装置10は、利用者が求める回答文の条件に基づいて回答文が選定されたら、選定された回答文に対して文体の変更を行う。
【0022】
例えば、利用者Q1が質問文として、前述の質問文Aを入力した場合に、情報提供装置10が回答文として、回答文A「ユニクロマスク3枚で、送料無料はお得である」、及び回答文B「サイトAはユニクロマスクの送料が有料だったから、送料無料はお得だ!」という回答文が選定されたとする。この場合、情報提供装置10は、回答文A、及び回答文Bに対して文体の変換を行う。例えば、情報提供装置10は、常体文(「だ」・「である」調)で記載された回答文A、及び回答文Bに対して、敬体文(「です」・「ます」調)の文体に変換し、回答文AX「ユニクロマスク3枚で、送料無料はお得です」、及び回答文BX「サイトAはユニクロマスクの送料が有料だったから、送料無料はお得です」に変換する。なお、情報提供装置10が変換する文体は、常体文から敬体文に限られず、その他の任意の文体に変換してよい。
【0023】
これにより、利用者は、質問文を入力することで得たいと考えた情報を、適切な文体に変換された上で取得することが可能となるため、不適切な文体によって利用者が気分を害することを無くすことができる。その為、利用者の質問頻度が向上し、Q&Aサイトを活性化させることができる。
【0024】
〔1-4.利用者の好みの文体への回答文の文体の変換について〕
ここで、回答文の文体を画一的に特定の文体に変換するのではなく、回答文の文体を利用者の好みの文体に変換すると、利用者の満足度を向上させることができると考えられる。
【0025】
そこで、情報提供装置10は、利用者が入力した質問文を含む情報に基づいて、利用者の好みの文体を推定し、選定された回答文に対して、推定された好みの文体に変換する。
【0026】
例えば、情報提供装置10は、利用者Q1が入力した質問文や、利用者Q1が検索したワードや、利用者Q1が閲覧したWEBサイトといった情報から、利用者の好みの文体を推定する。例えば、情報提供装置10が、利用者Q1が閲覧したWEBサイトの情報に基づいて、利用者Q1の好みの文体が「少年漫画風」であると推定したとする。また、前述の例と同じく、情報提供装置10が、回答文として回答文A「ユニクロマスク3枚で、送料無料はお得である」及び回答文B「サイトAはユニクロマスクの送料が有料だったから、送料無料はお得だ!」を選定したとする。この場合、情報提供装置10は、推定した利用者Q1の好みの文体である「少年漫画風」に回答文A、及び回答文Bの文体を変換する。例えば、回答文A、及び回答文Bのフォントを、劇画調のフォントに変更する。なお、情報提供装置10が変換する文体は、「少年漫画風」に限定されるものではなく、利用者の好みに応じて、その他の任意の文体に変換してよい。
【0027】
これにより、利用者は、質問文を入力することで得たいと考えた情報を、利用者の好みの文体に変換されたうえで、取得することが可能となるため、利用者の満足度を高めることができる。その為、利用者の質問頻度が向上し、Q&Aサイトを活性化させることができる。
【0028】
〔1-5.質問文の特徴と回答文の特徴の関係を学習した学習モデルの使用について〕
ここで、利用者が入力した質問文に対して、情報提供装置10が備えるQ&Aデータベース32に登録された回答文の中には、利用者が求める回答文が含まれていない場合がある。その為、各種の質問に対する回答のデータを学習した学習モデルを用いて、質問文から回答文を出力できると、Q&Aデータベース32を補うことができると考えられる。
【0029】
そこで、情報提供装置10は、各種の質問に対する回答のデータセットを用いて、質問文の特徴と回答文の特徴との関係を学習し、回答学習モデル34を生成する。情報提供装置10は、利用者が入力した質問文を、回答学習モデル34に入力し、回答文の出力を得る。
【0030】
例えば、情報提供装置10のQ&Aデータベース32には、「漫画」に関する質問と回答についてのデータが不足していたとする。この場合、情報提供装置10は、外部から取得した「漫画」に関する質問と回答のデータセットを用いて、質問文の特徴と回答文の特徴を学習し、回答学習モデル34を生成する。そして、情報提供装置10は、利用者が「漫画」についての質問文を入力したとすると、利用者が入力した質問文を回答学習モデル34に入力し、回答学習モデル34から回答文の出力を得る。並行処理であってもよいし、連続処理であってもよいが、情報提供装置10は、利用者が入力した質問文に基づいて、1-2に記載した処理を実行して、Q&Aデータベース32から回答文を選定する。その後、情報提供装置10は、回答学習モデル34が出力した回答文が、利用者が求める回答文の条件を充足するか否かを判定する。情報提供装置10は、回答学習モデル34が出力した回答文が、利用者が求める回答文の条件を充足すると判定された場合、Q&Aデータベース32から選定された回答文と、回答学習モデル34が出力した回答文を用いて、利用者の端末装置に表示する為のコンテンツ情報を生成して、利用者の端末装置に配信する。
【0031】
これにより、利用者が質問文を入力することで得たいと考えた情報が、情報提供装置10のQ&Aデータベース32に登録された質問文と回答文のデータに不足していたとしても、外部のデータセットを用いて学習された学習モデルを用いて、回答文を出力することで、利用者が求める回答文を得る可能性を向上させることができる。その為、利用者の質問頻度が向上し、Q&Aサイトを活性化させることができる。
【0032】
〔1-6.利用者の質問に対する他の利用者の回答の補助について〕
ここで、利用者が入力した質問文に対して、他の利用者が回答文を入力する際に、利用者が求める回答文を入力するように、回答文を入力する他の利用者を補助すると、より利用者が求める回答文を、他の利用者が入力しやすくなると考えられる。
【0033】
そこで、情報提供装置10は、利用者が入力した質問文に対して、他の利用者が回答文を入力する際に、利用者が求める情報の入力を促す。
【0034】
例えば、1-2に記載したように利用者が質問文Aを入力して、利用者が求める回答文の条件が、条件1「ユニクロマスクのネットでの初回購入者のみが送料無料はお得か否かについての情報を含むこと」、及び条件2「他のネット通信販売サイトで、ユニクロマスクを購入した場合の送料についての情報が含まれること。」と設定されたとする。この場合、情報提供装置10は、利用者が入力した質問文Aに対して、他の利用者が回答文を入力する際に、条件1、及び条件2を他の利用者の使用する端末装置に表示させる。
【0035】
これにより、利用者の質問文に対して他の利用者が回答文を入力する際に、他の利用者に対して質問文を入力した利用者が求める回答文を入力することを補助することができる。その為、他の利用者から、質問文を入力した利用者が求める回答文が入力される可能性を上げることができる。その為、利用者の質問頻度が向上する。また、回答文を入力した他の利用者のベストアンサー獲得確率を向上させることができる。その結果、Q&Aサイトを活性化させることができる。
【0036】
〔1-7.要求充足度の計算について〕
ここで、利用者が入力した質問文に対して、情報提供装置10が選定した回答文がどの程度、利用者の要求を満足しているか示す数値が利用者の端末装置に表示されると、利用者は、情報提供装置10が選定した回答文のうち、どの回答文を最初に参照すればよいかの判断を即座に行えることができて有益である。
【0037】
そこで、情報提供装置10は、利用者が求める回答文の条件と、選定した回答文との関係に基づいて、選定された回答文が、利用者が求める回答文にどの程度近いかを示す要求充足度を計算する。
【0038】
例えば、情報提供装置10が回答文の条件として、条件Aから条件Dの4つの条件を設定したとする。そして、情報提供装置10が選定した回答文Aが条件Aから条件Dの4つの条件のうち、条件Aから条件Cの3つの条件は充足するが、条件Dは充足しなかったとする。この場合、情報提供装置10は、回答文Aの要求充足度を75%と計算する。そして、情報提供装置10は、計算された要求充足度を回答文Aの情報とともに、利用者の端末装置に表示させる。
【0039】
これにより、利用者が入力した質問文に対する回答文が利用者の端末装置に表示される際に、選定された回答文の要求充足度も表示されるため、利用者はどの回答文を最初に参照すればよいかの判断を即座に行うことができる。その為、利用者の満足度が向上し、Q&Aサイトを活性化させることができる。
【0040】
〔2.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。なお、以下の説明では、Q&Aサイトにおいて回答処理を実行する情報提供装置10が有する機能構成の一例を示す。
図2は、第1実施形態に係る情報提供装置の構成例を示す図である。
図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
【0041】
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、端末装置Tとの間で情報の送受信を行う。
【0042】
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、利用者データベース31、Q&Aデータベース32、文体学習モデル33、回答学習モデル34、を記憶する。以下、
図3、
図4を用いて、利用者データベース31およびQ&Aデータベース32に登録される情報の一例について説明する。
【0043】
利用者データベース31には、質問者若しくは回答者となる利用者の情報が登録されている。例えば、
図3は、第1実施形態に係る利用者データベースに登録される情報の一例を示す図である。
図3に示すように、利用者データベース31には、「利用者ID(Identifier)」、「質問履歴」、「回答履歴」、「検索履歴」、「閲覧履歴」といった項目を有する情報が登録される。
【0044】
ここで、「利用者ID」とは、利用者を識別するための識別子である。また、「質問履歴」とは、利用者により投稿された質問の履歴である。また、「回答履歴」とは、利用者により投稿された回答の履歴である。また、「検索履歴」とは、利用者により検索された語句(単語、フレーズ、複合語など)の履歴である。また、「閲覧履歴」とは、検索結果に表示された情報のうち利用者によって閲覧された情報の履歴である。
【0045】
例えば、
図3に示す例では、利用者データベース31には、利用者ID「U1」、質問履歴「質問履歴#U1」、回答履歴「回答履歴#U1」、検索履歴「検索履歴#U1」、閲覧履歴「閲覧履歴#U1」といった情報が登録されている。このような情報は、利用者ID「U1」が示す利用者により、質問履歴「質問履歴#U1」が示す質問が投稿され、回答履歴「回答履歴#U1」が示す回答が投稿され、検索履歴「検索履歴#U1」に示す語句が検索され、閲覧履歴「閲覧履歴#U1」が示す情報が閲覧されたことを示している。
【0046】
なお、
図3に示す例では、質問履歴#U1、回答履歴#U1、検索履歴#U1、閲覧履歴#U1といった概念的な表現を用いて、利用者データベース31に登録される情報を記載したが、実際には、利用者によって投稿された質問文や回答文となる文字情報、検索された語句を示す文字情報、閲覧された情報を示す文字情報が登録されることとなる。また、
図3に示す情報以外にも、利用者に関するその他の任意の情報が利用者データベース31に登録されていてよい。
【0047】
Q&Aデータベース32には、利用者によって投稿された質問文、及び質問文に対して他の利用者が投稿した回答文の集合、及び他の利用者が投稿した回答文の集合の中から質問を入力した利用者によってベストアンサーに選択された回答文に関する情報が登録されている。例えば、
図4は、第1実施形態に係るQ&Aデータベースに登録される情報の一例を示す図である。
図4に示すように、Q&Aデータベース32には、「質問ID」、「質問文」、「回答文集合」、「選択情報」といった項目を有する情報が登録される。なお、回答文集合とは、利用者によって投稿された質問文に対して、一人以上の他の利用者から投稿された回答文を一つに纏めた情報である。
【0048】
図4に示す例では、質問ID「Q1」、質問文「質問文#1」、回答文集合「回答文集合#1」、選択情報「回答文#1-1」といった情報が対応付けて登録されている。このような情報は、質問ID「Q1」の質問が、質問文「質問文#1」に質問内容が示されており、その質問に対して他の利用者から回答文集合「回答文集合#1」に示す回答文が入力され、質問を入力した利用者によって選択情報「回答文#1-1」が示す回答文がベストアンサーとして選択されたことを示す。
【0049】
なお、
図4に示す例では、「質問文#1」、「回答文集合#1」、「回答文#1-1」といった概念的な表現を記載したが、実際には、質問文の文字情報、質問文に対して回答された回答文の集合の文字情報、が登録されることとなる。また、
図4に示す情報以外にも、例えば、Q&Aデータベース32には、質問を行った利用者の利用者IDや、質問に対して回答を行った利用者の利用者IDなど、各種の質問と回答に関する任意の情報が登録されていてもよい。
【0050】
文体学習モデル33には、未学習の文体学習モデル及び学習済みの文体学習モデルが記憶される。学習済みの文体学習モデルとしては、後述する文体学習部421が学習処理を実行することで生成された文体学習モデルが記憶される。なお、後述する文体学習部421が学習処理を実行する際には、文体学習モデル33に記憶された未学習の文体学習モデルを用いて学習処理を実行する。
【0051】
回答学習モデル34には、未学習の回答学習モデル及び学習済みの回答学習モデルが記憶される。学習済みの回答学習モデルとしては、後述する回答学習部422が学習処理を実行することで生成された回答学習モデルが記憶される。なお、後述する回答学習部422が学習処理を実行する際には、回答学習モデル34に記憶された未学習の回答学習モデルを用いて学習処理を実行する。
【0052】
制御部40は、例えば、コントローラ(controller)であり、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報提供装置10の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部40は、コントローラであり、例えば、ASIC(Application Specific Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0053】
図2に示すように、制御部40は、収集部41、学習部42、受付部43、推定部44、解析部45、選定部46、変換部47、計算部48、補助部49、および提供部50、を有する。
【0054】
収集部41は、学習モデルの生成などに使用する各種のデータを収集する。例えば、収集部41は、各利用者が過去に入力した検索クエリ、利用者が過去に入力した質問文や回答文、利用者がベストアンサーとして選択した回答文など、を過去ログとして収集する。
【0055】
学習部42は、文体学習部421と回答学習部422とを備える。文体学習部421は、質問文の文体の特徴と、利用者が満足した回答文の文体の特徴との関係を学習し、文体学習モデル33を生成する。文体学習部421は、例えば、Q&Aデータベース32に登録された質問文と、利用者が選択したベストアンサーを示す選択情報を学習データとしてもよい。また、文体学習部421は、例えば、利用者が満足した回答文に対して形態素解析を行った後に、RNN(Recurrent Neural Network)や、LSTM(Long Short-Term Memory)を用いて、学習を実施することで、利用者の好みの文体の語順を学習した文体学習モデル33を生成してもよい。
【0056】
回答学習部422は、質問文の特徴と回答文の特徴との関係を学習し、回答学習モデル34を生成する。ここで、回答学習部422は、Q&Aデータベース32に登録された質問文と、質問文に対する回答文の集合と、を学習データとしてもよい。また、回答学習部422は、例えば、BERT(Bidirectional Encoder Representations from Transformers)を用いて、教師なしで膨大な文章から言語の構造を捉える事前学習を行った後に、Q&Aデータベース32に登録された質問文と回答文集合のデータを学習データとして、再調整を行うことで、回答学習モデル34を生成してもよい。
【0057】
受付部43は、利用者から質問や回答の登録を受付ける。例えば、受付部43は、利用者が使用する端末装置から質問となる文章を受付けると、受付けた文章を質問文としてQ&Aデータベース32に登録する。また、受付部43は、回答者が使用する端末装置から回答となる文章を受付けると、受付けた文章を、対応する質問文の質問IDと対応付けて、Q&Aデータベース32に登録する。
【0058】
推定部44は、利用者が入力した質問文を含む情報に基づいて、利用者の好みの文体を推定する。推定部44は、例えば、利用者が入力した質問文の文体を利用者の好みの文体と推定してもよいし、利用者データベース31に登録された検索履歴が示す情報に基づいて利用者の好みの文体を推定してもよいし、利用者データベース31に登録された閲覧履歴が示す利用者が閲覧した情報に使用されている文体を利用者の好みの文体と推定してもよい。
【0059】
解析部45は、利用者から受け付けた質問文を解析して、回答文に求められる条件を設定する。例えば、質問文に対して形態素解析を実施して、質問文を形態素の列に分割して、品詞を判別した後に、質問文に含まれるキーワードを抽出することで、回答文に抽出されたキーワードが含まれることを回答文の条件としてもよい。また、形態素解析を行った質問文に含まれる疑問詞とその周囲の語から、特定のカテゴリ(例えば、地名、時間、数量、人名)に該当する情報が含まれることを回答文の条件としてもよい。
【0060】
選定部46は、解析部45が設定した回答文に求められる条件に基づいて、Q&Aデータベース32に登録された回答文の中から、利用者が入力した質問文に対する回答文を検索し、回答文に求められる条件を充足する回答文を選定する。例えば、利用者が「日本の首都はどこ?」という質問文を入力し、解析部45が回答文の条件として、キーワード「日本の首都」が含まれることを回答文の条件A、カテゴリ「地名」に該当する情報が含まれることを条件B、とした場合、選定部46は、Q&Aデータベース32に登録された回答文集合の中から、条件A、及び条件Bを充足する回答文を選定する。なお、選定部46は、Q&Aデータベース32に登録された回答文集合の中に、解析部45が設定した条件を全て充足する回答文が無かった場合は、Q&Aデータベース32に登録された回答文のうち、少なくとも1つの条件を充足する回答文を選定する。
【0061】
変換部47は、選定部46が選定した回答文に対して、文体の変換を行う。文体の変換(スタイル変換)とは、言い換え生成の一種である。例えば、変換部47は、選定部46が選定した回答文が常体文(「だ」・「である」調)であった場合に、敬体文(「です」・「ます」調)に変換する。変換部47は、例えば、文体学習部421が生成した文体学習モデル33を用いて、選定部46が選定した回答文に対して、文体の変換を行ってもよい。また、変換部47は、例えば、文章の意味情報と文体情報を分離して、分離後の意味情報に対して文体情報を付与してもよい。また、変換部47は、GAN(Generative Adversal Networks)やVAE(Variational AutoEncoder)を用いて生成された学習モデルを用いて、選定部46が選定した回答文に対して、文体を変換してもよい。
【0062】
計算部48は、解析部45が設定した利用者が求める回答文の条件と、選定部46が選定した回答文との関係に基づいて、選定部46が選定した回答文が、利用者が求める回答文にどの程度近いかを示す要求充足度を計算する。例えば、計算部48は、解析部45が回答文の条件として条件Aから条件Dの4つの条件を設定した場合に、選定部46が選定した回答文が、解析部45が選定した条件Aから条件Dの4つの条件のうち、条件Aから条件Cの3つの条件は充足するが、条件Dは充足しなかった場合、要求充足度を75%と計算する。
【0063】
補助部49は、利用者が投稿した質問文に対して、他の利用者が回答文を投稿する際に、利用者が求める情報の入力を促す。例えば、補助部49は、利用者が投稿した質問文を解析部45が解析し、利用者が求める回答文の条件が設定された後に、他の利用者が回答文の投稿を行っている際に、利用者が求める回答文の条件を、回答文の投稿を行っている他の利用者の端末装置に表示させて、他の利用者の回答文の入力を補助してもよい。
【0064】
提供部50は、選定部46により選定された回答文を、質問を投稿した利用者に対して提供する。また、提供部50は、選定部46により選定された回答文に対して、変換部47により文体の変換が行われた回答文を、質問を投稿した利用者に対して提供する。また、提供部50は、計算部48により計算された要求充足度を、質問を投稿した利用者に対して提供してもよい。例えば、提供部50は、選定部46により選定された回答文に対して、変換部47により文体の変換が行われた回答文を含むコンテンツ情報を生成し、生成したコンテンツ情報を端末装置へと配信する。
【0065】
〔3.処理手順〕
次に、
図5を用いて、第1実施形態に係る情報提供装置10による回答処理の手順について説明する。
図5は、第1実施形態に係る回答処理の流れの一例を示すフローチャートである。例えば、情報提供装置10は、利用者から質問文を含む情報を取得する(ステップS101)。そして、情報提供装置10は、利用者が求める回答文の条件を設定する(ステップS102)。そして、情報提供装置10は、回答文の条件が設定されたら、利用者が求める回答文の条件に基づいて回答文を選定する(ステップS103)。そして、情報提供装置10は、選定された回答文に対して文体の変換を行う(ステップS104)。
【0066】
〔4.ハードウェア構成〕
また、上述した実施形態に係る情報提供装置10は、例えば
図6に示すような構成のコンピュータ1000によって実現される。
図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0067】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0068】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0069】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0070】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0071】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0072】
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
【0073】
〔5.効果〕
本開示に係る情報提供装置10は、利用者が入力した質問文を含む情報を解析して、利用者が求める回答文の条件を設定する解析部45と、解析部45により設定された利用者が求める回答文の条件に基づいて回答文を選定する選定部46と、を備える。
【0074】
この構成によれば、利用者が入力した質問文を解析して、利用者が求める回答文の条件を設定し、設定された回答文の条件に基づいて回答文を選定することから、利用者が求める回答文を選定することができる。
【0075】
また、本開示に係る情報提供装置10は、選定部46が選定した回答文に対して、文体の変換を行う変換部47と、を備える。
【0076】
この構成によれば、選定部46が選定した回答文に対して、文体の変換を行うことから、利用者に対して適切に情報を提供することができる。
【0077】
また、本開示に係る情報提供装置10は、利用者が入力した質問文を含む情報に基づいて、利用者の好みの文体を推定する推定部44と、変換部47は、選定部46が選定した回答文に対して、推定部44が推定した利用者の好みの文体に変換する。
【0078】
この構成によれば、利用者が入力した質問文を含む情報に基づいて、利用者の好みの文体を推定し、選定部46が選定した回答文に対して、推定部44が推定した利用者の好みの文体に変換することから、利用者に対して適切に情報を提供することができる。
【0079】
また、本開示に係る情報提供装置10は、質問文の文体の特徴と、利用者が満足した回答文の文体の特徴との関係を学習し、文体学習モデル33を生成する文体学習部421と、を備え、変換部47は、選定部46が選定した回答文に対して、文体学習部421を用いて利用者が満足した回答文の文体に変換する。
【0080】
この構成によれば、選定部46が選定した回答文に対して、文体学習モデル33を用いて利用者が満足した回答文の文体に変換することから、利用者に対して適切に情報を提供することができる。
【0081】
また、本開示に係る情報提供装置10は、質問文の特徴と回答文の特徴との関係を学習し、回答学習モデル34を生成する回答学習部422と、を備え、選定部46は、回答学習部422が生成した回答学習モデル34を用いて出力された回答文を選定対象に含む。
【0082】
この構成によれば、質問文の特徴と回答文の特徴との関係を学習した回答学習モデル34を用いて、出力された回答文が選定部46の選定対象に含まれることから、より適切に利用者が求める情報を利用者に対して提供することができる。
【0083】
また、本開示に係る情報提供装置10は、利用者が入力した質問文に対して、他の利用者が回答文を入力する際に、利用者が求める情報の入力を促す補助部49と、を備える。
【0084】
この構成によれば、利用者が入力した質問に対して、他の利用者が回答文を入力する際に、利用者が求める情報の入力が促されることから、利用者に対してより適切に情報を提供することができる。
【0085】
また、本開示に係る情報提供装置10は、解析部45が設定した利用者が求める回答文の条件と、選定部46が選定した回答文との関係に基づいて、選定部46が選定した回答文が、利用者が求める回答文にどの程度近いかを示す要求充足度を計算する計算部48と、を備える。
【0086】
この構成によれば、利用者が求める回答文の条件をどの程度充足しているかを示す要求充足度を計算することができ、計算された要求充足度を利用者の満足度の推定に役立てることができる。
【0087】
本開示に係る回答方法は、利用者が入力した質問文を含む情報を取得するステップと、利用者が入力した質問文を含む情報に基づいて利用者が求める回答文の条件を設定するステップと、利用者が求める回答文の条件に基づいて回答文を選定するステップと、選定された回答文に対して文体の変換を行うステップと、を含む。
【0088】
この構成によれば、利用者が求める情報を適切に提供することができる。
【0089】
本開示に係る回答プログラムは、利用者が入力した質問文を含む情報を取得するステップと、利用者が入力した質問文を含む情報に基づいて利用者が求める回答文の条件を設定するステップと、利用者が求める回答文の条件に基づいて回答文を選定するステップと、選定された回答文に対して文体の変換を行うステップと、をコンピュータに実行させる。
【0090】
この構成によれば、利用者が求める情報を適切に提供することができる。
【0091】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0092】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0093】
10 情報提供装置
20 通信部
30 記憶部
31 利用者データベース
32 Q&Aデータベース
33 文体学習モデル
34 回答学習モデル
40 制御部
41 収集部
42 学習部
43 受付部
44 推定部
45 解析部
46 選定部
47 変換部
48 計算部
49 補助部
50 提供部
N ネットワーク
T 端末装置