IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

特許7749093質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム
<>
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図1
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図2
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図3
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図4
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図5
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図6
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図7
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図8
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図9
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図10
  • 特許-質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-09-25
(45)【発行日】2025-10-03
(54)【発明の名称】質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラム
(51)【国際特許分類】
   G06F 16/90 20190101AFI20250926BHJP
   G06Q 50/10 20120101ALI20250926BHJP
【FI】
G06F16/90
G06Q50/10
【請求項の数】 8
(21)【出願番号】P 2024189341
(22)【出願日】2024-10-28
【審査請求日】2024-10-28
(73)【特許権者】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100110135
【弁理士】
【氏名又は名称】石井 裕一郎
(74)【代理人】
【識別番号】100132883
【弁理士】
【氏名又は名称】森川 泰司
(74)【代理人】
【識別番号】100148633
【弁理士】
【氏名又は名称】桜田 圭
(74)【代理人】
【識別番号】100163452
【弁理士】
【氏名又は名称】南郷 邦臣
(74)【代理人】
【識別番号】100180312
【弁理士】
【氏名又は名称】早川 牧子
(72)【発明者】
【氏名】木下 和俊
(72)【発明者】
【氏名】福田 英士
【審査官】原 秀人
(56)【参考文献】
【文献】特開2023-064408(JP,A)
【文献】特開2022-051113(JP,A)
【文献】特開2024-155674(JP,A)
【文献】米国特許出願公開第2023/0061906(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 50/10
(57)【特許請求の範囲】
【請求項1】
質問に回答可能な候補者を、該候補者の特性情報に基づいて複数のクラスタに分類する分類部と、
前記分類された各前記クラスタに含まれる前記候補者の前記特性情報に基づいて、各前記クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求める算出部と、
質問文を受け付ける受付部と、
各前記クラスタについて求められた前記代表者特性を有する代表者を模擬する生成AIに、前記受付部により受け付けられた質問文に対する回答を模擬生成させる生成部と、
を備える生成装置。
【請求項2】
前記特性情報は、前記候補者の属性および行動履歴を含む、
請求項1に記載の生成装置。
【請求項3】
前記算出部は、前記分類された前記クラスタに属する候補者のうち、該クラスタの重心に最も近い候補者の前記特性情報に基づいて、前記代表者特性を前記クラスタ毎に求める、
請求項1または2に記載の生成装置。
【請求項4】
前記算出部は、前記分類された前記クラスタ毎に、該クラスタにおける前記特性情報の平均値を前記代表者特性として求める、
請求項1または2に記載の生成装置。
【請求項5】
前記生成部は、前記受付部により受け付けられた質問文と、前記算出部により求められた前記代表者特性と、に基づき、該代表者特性を有する代表者を模擬して前記質問文に対する回答を生成するよう前記生成AIに指示するプロンプトを生成し、生成されたプロンプトを前記生成AIに送信する、
請求項1または2に記載の生成装置。
【請求項6】
前記生成部は、前記生成された回答と、該回答に係るクラスタの大きさと、を対応付けて出力する、
請求項1または2に記載の生成装置。
【請求項7】
コンピュータが、
質問に回答可能な候補者を、該候補者の特性情報に基づいて複数のクラスタに分類するステップと、
前記分類された各前記クラスタに含まれる前記候補者の前記特性情報に基づいて、各前記クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求めるステップと、
質問文を受け付けるステップと、
各前記クラスタについて求められた前記代表者特性を有する代表者を模擬する生成AIに、前記受け付けられた質問文に対する回答を模擬生成させるステップと、
を実行する生成方法。
【請求項8】
コンピュータに、
質問に回答可能な候補者を、該候補者の特性情報に基づいて複数のクラスタに分類する処理と、
前記分類された各前記クラスタに含まれる前記候補者の前記特性情報に基づいて、各前記クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求める処理と、
質問文を受け付ける処理と、
各前記クラスタについて求められた前記代表者特性を有する代表者を模擬する生成AIに、前記受け付けられた質問文に対する回答を模擬生成させる処理と、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質問に対する回答を模擬生成する生成装置、生成方法、ならびに、プログラムに関する。
【背景技術】
【0002】
インターネットを経由して多数のユーザを対象として様々な分野で、インタビューやアンケート等の調査が行われている。一例として特許文献1には、従来のアンケート調査に比べて、高速かつ低価格でアンケート調査を行うために、デジタルクローンアンケート調査を実現することができるシステムが開示されている。
【0003】
このシステムは、個人の表現を学習し、その個人の表現に従って文章を生成するパーソナライズドAIに、アンケートの質問に対する回答を出力させる。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2022-32935号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、上記のような調査を実施した後に、集まった回答を見て初めて、質問の表現をこうしておけばよかった、こういう質問を一緒にすれば良かったなどの改善点に気付くことがある。この場合、質問を修正して、再度調査する必要がある。そのため、アンケート実施前に、質問の有効性や適切性を評価するための多様な回答のサンプルを得たいとの要望があった。
【0006】
本発明は、上記実状に鑑みてなされたもので、事前に質問の有効性や適切性を評価するための多様な回答を得ることが可能な生成装置、生成方法、ならびに、プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の課題を解決するため、本発明に係る生成装置は、
質問に回答可能な候補者を、該候補者の特性情報に基づいて複数のクラスタに分類する分類部と、
前記分類された各前記クラスタに含まれる前記候補者の前記特性情報に基づいて、各前記クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求める算出部と、
質問文を受け付ける受付部と、
各前記クラスタについて求められた前記代表者特性を有する代表者を模擬する生成AIに、前記受付部により受け付けられた質問文に対する回答を模擬生成させる生成部と、
を備える。
【発明の効果】
【0008】
本発明によれば、事前に質問の有効性や適切性を評価するための多様な回答を得ることが可能な生成装置、生成方法、ならびに、プログラムを提供することができる。
【図面の簡単な説明】
【0009】
図1】生成装置と他の機器の連携を示す説明図である。
図2】生成装置の機能的な構成を示す説明図である。
図3図2に示すユーザDBに記憶される属性テーブルの一例を示す図である。
図4図2に示すユーザDBに記憶される行動履歴テーブルの一例を示す図である。
図5図2に示す分類部により生成される分類結果テーブルの一例を示す図である。
図6図2に示す算出部により生成される代表者特性テーブルの一例を示す図である。
図7】生成装置の物理構成を示す説明図である。
図8】生成装置による候補者分類処理のフローチャートである。
図9】生成装置による回答生成処理のフローチャートである。
図10図2に示す生成部により生成されるプロンプトの一例を示す図である。
図11】生成部により生成される回答テーブルの一例を示す図である。
【発明を実施するための形態】
【0010】
本発明を実施するための形態に係る生成装置、生成方法、ならびに、プログラムについて、図面を参照して詳細に説明する。なお、図中同一又は相当する部分には同一符号を付す。なお、本実施形態は説明のためのものであり、本願発明の範囲を制限するものではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本発明の範囲に含まれる。
【0011】
(全体構成)
図1は、本発明の実施の形態に係る生成装置100と他の機器の連携を示す説明図である。図示する通り、生成装置100は、端末200および生成AI(Artificial Intelligence)サーバ300と、通信ネットワーク400を介して通信可能に接続されている。なお、図1において、1つの端末200が図示されているが、適用可能な端末200の数はこれに限られず、複数の端末200が適用されてもよい。
【0012】
生成装置100は、1台もしくは複数台のサーバコンピュータにより構成される。生成装置100は、例えば、アンケートに対する回答を含むタスクを、不特定多数のユーザに依頼するクラウドソーシングサービスを提供する事業者により運用される。
【0013】
生成装置100は、アンケートの質問文を受け付け、受け付けられた質問文に対する回答を模擬生成する装置である。具体的に、生成装置100は、アンケートに回答可能な候補者を、候補者の特性情報に基づいて複数のクラスタに分類する。特性情報は、例えば、候補者の年齢、性別、職業などの属性と、商品の購買、過去のアンケートへの回答などの行動履歴と、を含む。
【0014】
生成装置100は、分類されたクラスタ毎に、クラスタを代表する代表者の特性を示す代表者特性を求める。生成装置100は、求められた各クラスタの代表者特性に基づいて、当該代表者を模擬して質問文に対する回答を模擬生成するよう生成AIサーバ300に指示するプロンプトをクラスタ毎に生成する。生成装置100は、生成されたそれぞれのプロンプトを生成AIサーバ300に送信し、質問文に対する回答を模擬生成させる。
【0015】
端末200は、PC(Personal Computer)、タブレット、スマートフォン等の情報端末(所謂コンピュータ)であり、例えば、クラウドソーシングサービスでアンケートの実施を依頼する企業や個人を示す依頼者等が使用する端末である。依頼者は、端末200を使用してアンケートの質問文を作成したり、生成装置100により模擬生成された回答を閲覧して、質問文を修正する作業などを行う。
【0016】
生成AIサーバ300は、質問文に対する回答の生成を指示するプロンプトを入力として、回答を生成するAIが含まれる。生成AIサーバ300は、例えば、文章を生成する文章生成AIを含み、ChatGPT、GEMINI、Catchy、Notion AI、その他の文章生成AI、又はこれらを利用したプログラム、サービス、若しくはソフトウェアが含まれる。
【0017】
また、文章生成AIのモデルには、あらゆる言語モデル又は大規模言語モデル等が含まれ、例えば、GPT、PaLM、LaMDA、LLaMa、Claude、OpenCALM、又はこれらを改変、改良、転移学習、若しくは追加学習した言語モデル又は大規模言語モデル等が含まれる。
【0018】
なお、生成AIサーバ300は、さらに画像生成AIを含み、画像を生成する機能を備えてもよい。
【0019】
通信ネットワーク400は、様々なタイプのネットワークを含み得る。例えば、ローカルエリアネットワーク(LAN)インターネット等の広域ネットワーク(WAN)、公衆交換電話ネットワーク(PSTN)等のテレコミュニケーションネットワーク、無線ネットワーク、公衆交換ネットワーク、衛星ネットワーク、セルラーネットワーク、公衆陸上移動体通信網(PLMN)、メトロポリタンエリアネットワーク(MAN)、プライベートネットワーク、アドホックネットワーク、イントラネット、光ファイバベースのネットワーク等、これら又は他のタイプのネットワークの組み合わせである。
【0020】
(生成装置の機能構成)
図2は、生成装置100の機能構成を示す説明図である。生成装置100は、ユーザDB(Data base)110と、分類部120と、算出部130と、受付部140と、生成部150と、を備える。
【0021】
ユーザDB110は、アンケートに回答可能な候補者の特性情報を記憶し、過去に実施されたアンケートに対する候補者の回答、分類部120による候補者の分類結果、算出部130により求められた代表者特性などを記憶するデータベースである。アンケートに回答可能な候補者とは、例えば、クラウドソーシングサービスに登録しているユーザである。これらのユーザは、依頼者から提供されたタスクをオンライン上で受け取り、作業を行う。なお、クラウドソーシングサービスに登録している全ユーザのうち、例えば、一定期間ログインしていない、作業を行っていない等のユーザを除外して候補者としてもよいし、クラウドソーシングサービスに登録している全ユーザから所定の条件を満たすユーザを抽出して候補者としてもよい。
【0022】
具体的に、ユーザDB110は、各候補者の属性情報を記憶する属性テーブルと、各候補者の行動履歴を格納する行動履歴テーブルと、を含む。ここで、属性テーブルおよび行動履歴テーブルの一例を図3図4にそれぞれ示す。
【0023】
図3に例示する通り、属性テーブルは、候補者を一意に識別する情報である「ユーザID」と、各候補者の年齢、性別、職業、家族構成などを含む属性を示す「属性」と、の情報を含む。属性は、図示した例に限られず、例えば、候補者の住所、学歴、収入などの情報をさらに含んでもよいし、その他任意の情報の組み合わせであってもよい。
【0024】
図4に例示する通り、行動履歴テーブルは、候補者を一意に識別する情報である「ユーザID」と、候補者が行った行動の種類を示す「行動タイプ」と、候補者に購入された商品を一意に識別する情報を示す「商品ID」と、候補者に購入された商品のカテゴリを示す「商品カテゴリ」と、候補者が過去に回答したアンケートを一意に識別する情報を示す「アンケートID」と、候補者の回答を一意に識別する情報を含む「回答ID」と、行動が行われた日時を示す「タイムスタンプ」との情報を含む。図示する例において、「行動タイプ」には、「購入」または「アンケート回答」のいずれかが含まれるものとしているが、これらに限定されず、例えば、商品ページの閲覧、商品の検索、ブランド、ショップなどをお気に入りに登録など、さらに任意の行動を含んでもよい。なお、商品の購入等に関する情報は、電子商取引サービスを管理する図示せぬ管理サーバから取得されればよい。
【0025】
図2に戻り、分類部120は、アンケートに回答可能な候補者を複数のクラスタに分類する。具体的に、分類部120は、ユーザDB110に格納されている複数の候補者を、各候補者の特性情報に基づき、複数のクラスタに分類する。例えば、分類部120は、各候補者の特性情報(属性および行動履歴)をベクトル化した特徴ベクトルを相互に比較し、特徴ベクトルの類似度や距離に基づいて分類する。分類の手法は、階層型であってもよいし、非階層型であってもよい。階層型の分類に用いる計算方法として、ウォード法や、群平均法や、最短距離法や、最長距離法などの任意の方法を利用できる。また、非階層型の分類に用いる計算方法として、k-means法などの任意の方法を利用できる。
【0026】
分類部120は、分類結果を示す分類結果テーブルを生成し、ユーザDB110に記憶させる。ここで、分類結果テーブルの一例を図5に示す。図示する通り、分類結果テーブルは、候補者を一意に識別する情報である「ユーザID」と、分類部120により分類されたクラスタを一意に識別する情報である「クラスタID」と、を対応付けるテーブルである。
【0027】
図2に戻り、算出部130は、分類部120により分類された複数のクラスタそれぞれを代表する代表者の特性を示す代表者特性を求める。例えば、算出部130は、各クラスタに含まれる複数の候補者の特徴ベクトルに基づいて、代表ベクトルを生成する。算出部130は、例えば、クラスタに含まれる全候補者の特徴ベクトルの重心や、その重心に最も近い候補者の特徴ベクトルを、各クラスタの代表ベクトルとして算出する。算出部130は、算出された代表ベクトルに基づき、クラスタ毎の代表者特性を格納する代表者特性テーブルを生成する。
【0028】
ここで、代表者特性テーブルの一例を、図6に示す。図示する通り、代表者特性テーブルは、クラスタを一意に識別する情報である「クラスタID」と、各クラスタの代表者の「年齢層」、「性別」、「職業」、「家族構成」を含む「属性」と、購入された商品の「商品カテゴリ」、商品の「購入頻度」、過去に実施されたアンケートに対する代表者の回答データを一意に識別する情報である「アンケート回答」を含む「行動履歴」と、を含む。
【0029】
図2に戻り、受付部140は、質問文を受け付ける。具体的に、受付部140は、質問文を待ち受け、端末200から送信された質問文を受信する。
【0030】
生成部150は、受付部140により受け付けられた質問文に対する回答を生成する。具体的に、生成部150は、算出部130により求められた各クラスタの代表者特性と、受け付けられた質問文と、に基づき、代表者を模擬して質問文に対する回答を生成することを生成AIサーバ300に指示するプロンプトを、クラスタ毎に生成する。
【0031】
生成部150は、生成されたプロンプトを生成AIサーバ300に送信し、生成AIサーバ300によって生成された回答を取得する。生成部150の処理の詳細については後述する。なお、生成AIサーバ300は、生成部150の一部の機能として実現する構成としても構わない。
【0032】
(情報処理装置のハードウェア構成)
図7は、生成装置100のハードウェア構成を示すブロック図である。生成装置100は、プログラムに従った処理を実行するCPU11と、揮発性メモリであるRAM12と、不揮発性メモリであるROM13と、データを記憶する記憶部14と、情報の入力を受け付ける入力部15と、情報を可視化して表示する表示部16と、情報の送受信を行う通信部17と、を備え、これらが内部バス99を介して接続されている。
【0033】
CPU11は、生成装置100全体の動作を制御し、各構成要素と接続され、制御信号やデータをやりとりする。CPU11は、記憶部14に記憶されたプログラムをRAM12に読み出して実行することにより、各種処理を実行する。CPU11は、プログラムにより提供される主要な機能として、分類部120と算出部130と受付部140と生成部150とによる各処理を実行する。
【0034】
RAM12は、データやプログラムを一時的に記録するためのもので、記憶部14から読み出したプログラムやデータ、その他通信に必要なデータ等が保持される。RAM12は、CPU11のワークエリアとして使用される。
【0035】
ROM13は、生成装置100の基本動作のためにCPU11が実行する制御プログラム、BIOS(Basic Input Output System)等を記憶する。
【0036】
記憶部14は、ハードディスクドライブやフラッシュメモリ等を備え、CPU11が実行するプログラムを記憶し、プログラム実行の際に使用される各種データを記憶する。記憶部14は、ユーザDB110として機能する。
【0037】
入力部15は、タッチパネル、キーボード、マウス、通信装置等を備えるユーザインタフェースである。入力部15は、生成装置100の使用者から操作入力を受け付け、受け付けた操作入力に対応する信号をCPU11に出力する。
【0038】
表示部16は、情報を可視化して表示する液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等の表示装置である。
【0039】
通信部17は、ネットワークに接続する網終端装置又は無線通信装置、およびそれらと接続するシリアルインターフェース又はLAN(Local Area Network)インターフェースである。生成装置100は、通信部17を介して端末200、生成AIサーバ300等とやりとりをする。通信部17は、受付部140として機能する。
【0040】
(候補者分類処理)
続いて、生成装置100の動作について、図面を参照して説明する。まず、アンケートに回答可能な候補者を複数のクラスタに分類し、各クラスタを代表する代表者の代表者特性を算出する候補者分類処理について、図8を参照して説明する。
【0041】
候補者分類処理は、例えば、生成装置100の管理者からの実行指示に基づいて開始される。なお、生成装置100は、日毎、週毎、月毎など、予め設定されたタイミングで候補者分類処理を開始するように構成されてもよい。
【0042】
分類部120は、実行指示を待ち受け、実行指示を受信すると(ステップS101;Yes)、ステップS102に移行する。一方、分類部120は、実行指示を受信しない場合(ステップS101;No)、実行指示を待ち受ける。
【0043】
ステップS102にて、分類部120は、アンケートに回答可能な候補者の特性情報を取得する(ステップS102)。具体的に、分類部120は、ユーザDB110にアクセスし、図3に例示する属性テーブルと、図4に例示する行動履歴テーブルとを読み出す。
【0044】
次に、分類部120は、候補者を複数のクラスタに分類する(ステップS103)。具体的に、分類部120は、各候補者の属性および行動履歴に基づき、複数のクラスタに分類する。例えば、分類部120は、任意の分類手法によって、各候補者の属性および行動履歴をベクトル化した特徴ベクトルを基に候補者同士の類似度や距離を算出して、候補者を分類する。なお、性別や職業などのカテゴリデータやアンケートの回答のように、数値的な大小や順序を持たないデータの場合、これらを数値に変換して特徴ベクトルを生成すればよい。分類部120は、図5に例示する分類結果を示す分類結果テーブルを生成し、ユーザDB110に記憶させる。
【0045】
次に、算出部130は、ステップS103で生成された複数のクラスタそれぞれを代表する代表者の代表者特性をそれぞれ求める(ステップS104)。例えば、算出部130は、各クラスタに含まれる候補者の特徴ベクトルに基づいて、代表ベクトルを生成する。算出部130は、例えば、クラスタに含まれる全候補者の特徴ベクトルの重心や、その重心に最も近い候補者の特徴ベクトルを、各クラスタの代表ベクトルとして算出する。算出部130は、クラスタに含まれる全候補者の特徴ベクトルの平均を取ることにより、特徴ベクトルの重心を算出する。なお、自由回答形式のアンケート回答に関する代表者特性を求める場合、例えば、BoW(Bag of Words)、TF-IDF、単語埋め込み(Word Embeddings)等の任意の手法により特徴ベクトルを生成し、特徴ベクトルを基に、最も頻出する単語やフレーズを特定したり、クラスタごとの代表的なトピックを抽出してもよい。
【0046】
算出部130は、算出された代表ベクトルに基づき、クラスタ毎の代表者特性を格納する、図6に例示する代表者特性テーブルを生成し、ユーザDB110に記憶させ(ステップS105)、候補者分類処理を終了する。
【0047】
(回答生成処理)
次に、図9を参照して、生成装置100により実行される回答生成処理について説明する。
【0048】
受付部140は、質問文と当該質問文に対する回答生成指示とを受け付ける(ステップS201)。具体的に、端末200は、依頼者の操作に従い、作成された質問文とともに、回答生成指示を、生成装置100に送信する。
【0049】
受付部140は、質問文と回答生成指示とを受信すると(ステップS202;Yes)、受信した質問文を生成部150に送信し、ステップS203に移行する。一方、受付部140は、質問文と模擬回答の生成指示とを受信しない場合(ステップS202;No)、ステップS201に戻り、質問文を受け付ける。
【0050】
次に、生成部150は、候補者分類処理により生成されたクラスタ毎に、ステップS204~ステップS206の処理を繰り返し実行する(ステップS203)。
【0051】
ステップS204において、生成部150は、ステップS202で受信された質問文と各クラスタの代表者特性とに基づき、各クラスタの代表者を模擬して回答を生成するよう生成AIサーバ300に指示するプロンプトを生成する。ここで、プロンプトの一例を図10に示す。図示する例は、クラスタID1の代表者を模擬して、質問文1~5に対する回答を模擬生成させるためのプロンプトである。このプロンプトは、図6に例示する代表者特性テーブルに格納された、クラスタID1の属性および行動履歴に基づいて生成される。
【0052】
ステップS205において、生成部150は、回答を取得する。具体的に、生成部150は、ステップS204で生成されたプロンプトを生成AIサーバ300に送信する。生成部150は、生成AIサーバ300により生成された回答を取得する。
【0053】
次に、ステップS206において、生成部150は、全クラスタに対して、ループ1の処理を実行したか否かを判定する。生成部150は、未処理のクラスタがあると判定すると、未処理のクラスタに対してループ1の処理を実行する。一方、生成部150は、ステップS206にて、コンテンツ管理情報に含まれる全クラスタに対して、ループ1の処理を実行したと判定すると、ステップS207に移行する。
【0054】
ステップS207において、生成部150は、模擬生成された回答の一覧を示す回答テーブルを出力し、処理を終了する。ここで、回答テーブルの一例を図11に示す。図示する通り、回答テーブルは、クラスタIDと模擬生成された回答とを対応付けて格納するテーブルである。また、例示する通り、回答に加え、各クラスタの大きさ、すなわち、全候補者数のうちの各クラスタの候補者数の割合をさらに格納してもよい。これにより、アンケートの依頼者は、質問文に対し、どのような回答が多く収集されそうかを予測することが可能となる。なお、各クラスタの代表者特性や質問文を回答テーブルに含めてもよい。
【0055】
アンケートの依頼者は、模擬生成された回答を閲覧し、質問文を修正した方がよいと判断した場合、質問文を修正して再度回答生成処理を実行する。回答生成処理を繰り返し実行することにより、質問の目的に沿った回答を得るためのより適切な質問文を作成することができる。
【0056】
以上のように、生成装置100は、回答する候補者を特性情報に基づいて複数のクラスタに分類し、各クラスタの代表者の回答を模擬生成する。したがって、事前に質問の有効性や適切性を評価するための多様な回答を得ることできる。
【0057】
また、生成装置100は、ユーザDB110に格納された実際の候補者の特性情報に基づき、候補者を分類し、各クラスタを代表する代表者の代表者特性を生成AIサーバ300に与える。したがって、より現実に近いバリエーションの回答を得ることが可能となる。
【0058】
(変形例)
上記の実施形態において、生成装置100は、端末200から質問文を受け付けて、回答を模擬生成するものとして説明したがこれに限られない。生成装置100は、ユーザとのコミュニケーションを通じてアンケートの回答を得るチャットボットから質問を受け付け、受け付けられた質問への回答を模擬生成するものであってもよい。その場合、生成装置100は、チャットボットサーバに接続され、チャットボットから送信される質問に対する回答を生成させるプロンプトを生成して、生成AIサーバ300に送信すればよい。例えば、生成装置100は、分類された複数のクラスタのいずれかの代表者特性を含むプロンプトを生成AIサーバ300に送信してチャットボットとの一連のコミュニケーションを実行させ、それをクラスタの数分実行すればよい。これにより、例えば、人手によらずに多様な回答パターンによって、開発中のチャットボットの動作を検証したり、運用中のチャットボットの性能を改善することを目的としたシミュレーションをすることができる。なお、上述のチャットボットによるコミュニケーションは、インタビュー形式のものでもよい。例えば、チャットボットサーバは、事前に共通の質問を出力するのではなく、対話形式で、各ユーザ個別の質問を出力することで、ユーザの意見内容(例えば、ユーザの回答の感情)を掘り下げて回答を取得するようにしてもよい。すなわち、生成装置100は、アンケートの質問に限らず、インタビューの質問について処理を実行するようにしてもよい。
【0059】
また、生成装置100は、質問文が適切か否かを判定する判定部をさらに備えてもよい。例えば、判定部は、ステップS207で出力された回答テーブルに含まれるクラスタ毎の複数の回答に基づき、回答の多様性や質問と回答の関連性を評価し、評価結果に基づき、質問文が適切か否かを判定する。回答の多様性の評価を行う場合、判定部は、例えば、生成された複数の回答をそれぞれベクトルに変換し、コサイン類似度などを使って回答同士の類似度を計算し、類似度が低いほど多様性が高いと評価し、類似度が高いほど多様性が低いと評価すればよい。そして、判定部は、類似度が閾値以上の場合、回答の幅が制限されているため質問文が適切ではないと判定し、その旨の判定結果を出力すればよい。
【0060】
また、質問と回答の関連性の評価を行う場合、判定部は、例えば、質問と生成された回答とをベクトル化し、質問と回答間のコサイン類似度を計算して、質問文と生成された各回答間のコサイン類似度の平均を関連性スコアとして算出すればよい。関連性スコアは、生成された回答が質問に対してどれだけ意味的に関連しているかを示すため、判定部は、算出された関連性スコアが閾値以下の場合、質問が曖昧で質問意図が伝わっていない可能性があるため質問文が適切ではないと判定し、その旨の判定結果を出力すればよい。
【0061】
さらに、判定部により質問文が適切ではないと判定された場合、生成部150は、質問文の修正を指示するプロンプトを生成AIサーバ300に送信して、評価結果を加味した質問文を生成させてもよい。例えば、質問文の多様性が低いと評価された場合、生成部150は、「異なる視点やさまざまな意見を引き出せるように質問文を修正してください。」といったプロンプトを生成すればよい。また、質問と回答の関連性が低いと評価された場合、生成部150は、「より明確で具体的な質問文に修正してください。」といったプロンプトを生成すればよい。
【0062】
なお、上記実施の形態に係る生成装置100は、専用の装置によらず、通常のコンピュータを用いて実現可能である。例えば、コンピュータに上述のいずれかを実行するためのプログラムを格納した記録媒体から該プログラムをコンピュータにインストールすることにより、上述の処理を実行する生成装置100を構成してもよい。また、複数のコンピュータが協働して動作することによって、生成装置100を構成してもよい。
【0063】
また、上述の機能を、OS(Operating System)とアプリケーションとの分担、またはOSとアプリケーションとの協働により実現する場合等には、OS以外の部分のみを媒体に格納してもよい。
【0064】
また、搬送波にプログラムを重畳し、通信ネットワークを介して配信することも可能である。例えば、アプリケーションストア(App Store)にて当該プログラムを配布したり、通信ネットワーク上の掲示板(BBS、Bulletin Board System)に当該プログラムを掲示し、ネットワークを介して当該プログラムを配信してもよい。そして、これらのプログラムを起動し、オペレーティングシステムの制御下で、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行できるように構成してもよい。
【0065】
また、記憶部14が記憶する情報は、ネットワーク上に存在するクラウドサーバで一括管理され、生成装置100は、必要に応じて当該クラウドサーバにアクセスして情報の読み書きを行ってもよい。この場合、生成装置100はユーザDB110を備えなくてもよい。また、生成装置100による候補者分類処理および回答生成処理は、クラウドサーバに記憶された情報によって、クラウド上で実行されてもよい。
【0066】
以下、本開示の諸態様を付記としてまとめて記載する。
【0067】
(付記1)
質問に回答可能な候補者を、該候補者の特性情報に基づいて複数のクラスタに分類する分類部と、
前記分類された各前記クラスタに含まれる前記候補者の前記特性情報に基づいて、各前記クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求める算出部と、
質問文を受け付ける受付部と、
各前記クラスタについて求められた前記代表者特性を有する代表者を模擬する生成AIに、前記受付部により受け付けられた質問文に対する回答を模擬生成させる生成部と、
を備える生成装置。
【0068】
(付記2)
前記特性情報は、前記候補者の属性および行動履歴を含む、
付記1に記載の生成装置。
【0069】
(付記3)
前記算出部は、前記分類された前記クラスタに属する候補者のうち、該クラスタの重心に最も近い候補者の前記特性情報に基づいて、前記代表者特性を前記クラスタ毎に求める、
付記1または2に記載の生成装置。
【0070】
(付記4)
前記算出部は、前記分類された前記クラスタ毎に、該クラスタにおける前記特性情報の平均値を前記代表者特性として求める、
付記1または2に記載の生成装置。
【0071】
(付記5)
前記生成部は、前記受付部により受け付けられた質問文と、前記算出部により求められた前記代表者特性と、に基づき、該代表者特性を有する代表者を模擬して前記質問文に対する回答を生成するよう前記生成AIに指示するプロンプトを生成し、生成されたプロンプトを前記生成AIに送信する、
付記1から4のいずれか1つに記載の生成装置。
【0072】
(付記6)
前記生成部は、前記生成された回答と、該回答に係るクラスタの大きさと、を対応付けて出力する、
付記1から5のいずれか1つに記載の生成装置。
【0073】
(付記7)
コンピュータが、
質問に回答可能な候補者を、該候補者の特性情報に基づいて複数のクラスタに分類するステップと、
前記分類された各前記クラスタに含まれる前記候補者の前記特性情報に基づいて、各前記クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求めるステップと、
質問文を受け付けるステップと、
各前記クラスタについて求められた前記代表者特性を有する代表者を模擬する生成AIに、前記受け付けられた質問文に対する回答を模擬生成させるステップと、
を実行する生成方法。
【0074】
(付記8)
コンピュータに、
質問に回答可能な候補者を、該候補者の特性情報に基づいて複数のクラスタに分類する処理と、
前記分類された各前記クラスタに含まれる前記候補者の前記特性情報に基づいて、各前記クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求める処理と、
質問文を受け付ける処理と、
各前記クラスタについて求められた前記代表者特性を有する代表者を模擬する生成AIに、前記受け付けられた質問文に対する回答を模擬生成させる処理と、
を実行させるプログラム。
【0075】
本開示は、本開示の広義の精神と範囲を逸脱することなく、様々な実施の形態および変形が可能とされるものである。また、上述した実施の形態は、この開示を説明するためのものであり、本開示の範囲を限定するものではない。すなわち、本開示の範囲は、実施の形態ではなく、特許請求の範囲によって示される。そして、特許請求の範囲内およびそれと同等の開示の意義の範囲内で施される様々な変形が、この開示の範囲内とみなされる。
【産業上の利用可能性】
【0076】
本発明は、事前に質問の有効性や適切性を評価するための多様な回答を得ることが可能な生成装置、生成方法、ならびに、プログラムに好適に採用され得る。
【符号の説明】
【0077】
100 生成装置、200 端末、300 生成AIサーバ、400 通信ネットワーク、110 ユーザDB、120 分類部、130 算出部、140 受付部、150 生成部、11 CPU、12 RAM、13 ROM、14 記憶部、15 入力部、16 表示部、17 通信部、99 内部バス
【要約】
【課題】事前に質問の有効性や適切性を評価するための多様な回答を得ることが可能な生成装置、生成方法、ならびに、プログラムを提供する。
【解決手段】生成装置100は、質問に回答可能な候補者を、候補者の特性情報に基づいて複数のクラスタに分類する分類部120と、分類された各クラスタに含まれる候補者の特性情報に基づいて、各クラスタをそれぞれ代表する代表者の特性を示す代表者特性を求める算出部130と、質問文を受け付ける受付部140と、各クラスタについて求められた代表者特性を有する代表者を模擬する生成AIサーバ300に、受付部140により受け付けられた質問文に対する回答を模擬生成させる生成部150と、を備える。
【選択図】図2
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11