(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022032935
(43)【公開日】2022-02-25
(54)【発明の名称】アンケート調査のためのシステム、プログラム、および方法
(51)【国際特許分類】
G06Q 50/10 20120101AFI20220217BHJP
【FI】
G06Q50/10
【審査請求】有
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2021032842
(22)【出願日】2021-03-02
(31)【優先権主張番号】P 2020137016
(32)【優先日】2020-08-14
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】515018091
【氏名又は名称】株式会社オルツ
(71)【出願人】
【識別番号】518143369
【氏名又は名称】カン ホースーン
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100107489
【弁理士】
【氏名又は名称】大塩 竹志
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】カン ホースーン
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC11
(57)【要約】 (修正有)
【課題】デジタルクローンアンケート調査を実現可能な、アンケート調査のためのシステム等を提供する。
【解決手段】アンケート調査のためのシステムにおけるプロセッサ部120は、受信手段121と、複数のパーソナライズドAI(PAI
1~PAI
M)を有する回答生成手段122と、集計手段123と、を備える。受信手段121は、アンケート調査のための質問を受信する。回答生成手段122のパーソナライズドAIの各々は、受信した質問に対して回答を出力する。集計手段123は、複数のパーソナライズドAIの各々からの出力を集計する。
【選択図】
図4A
【特許請求の範囲】
【請求項1】
アンケート調査のためのシステムであって、
アンケート調査のための質問を受信する受信手段と、
複数のパーソナライズドAIであって、前記複数のパーソナライズドAIの各々は、前記受信された質問に対して回答を出力するように構成されている、複数のパーソナライズドAIと、
前記複数のパーソナライズドAIの各々からの出力を集計する集計手段と
を備えるシステム。
【請求項2】
前記複数のパーソナライズドAIの各々は、前記受信された質問に対して回答を出力することを複数回繰り返すことによって複数の回答を出力し、
前記集計手段は、前記複数のパーソナライズドAIの各々から出力された前記複数の回答を集計する、請求項1に記載のシステム。
【請求項3】
前記複数のパーソナライズドAIの各々は、相互に異なる個人の表現を学習しており、前記複数のパーソナライズドAIの各々は、前記学習した個人の表現に従って、文章を生成することが可能であり、
前記複数のパーソナライズドAIの各々は、前記質問に対する回答として、前記学習した個人の表現に従った文章を出力する、
請求項2に記載のシステム。
【請求項4】
文章に込められた感情を認識することが可能な感情認識手段をさらに備え、
前記感情認識手段は、
前記複数のパーソナライズドAIの各々から出力された前記複数の回答に込められた複数の感情を認識することと、
前記認識された複数の感情に基づく出力を生成することと
を行うように構成されており、
前記集計手段は、前記複数の感情に基づく出力を集計する、
請求項3に記載のシステム、
【請求項5】
前記感情認識手段は、
前記複数の感情のうち第1の感情が最も多い場合に第1の出力を生成し、
前記複数の感情のうち第2の感情が最も多い場合に第2の出力を生成する、
請求項4に記載のシステム。
【請求項6】
前記複数のパーソナライズドAIの各々は、前記個人の表現の偏りを是正することなく、前記個人の表現を学習している、請求項3~5のいずれか一項に記載のシステム。
【請求項7】
前記個人の表現は、実在する個人による表現である、請求項6に記載のシステム。
【請求項8】
前記個人の表現は、仮想的な個人による表現である、請求項6に記載のシステム。
【請求項9】
アンケート調査のための方法であって、
アンケート調査のための質問を受信することと、
複数のパーソナライズドAIを用いて、前記質問に対する複数の回答を出力することと、
前記複数のパーソナライズドAIの各々からの出力を集計することと
を含む方法。
【請求項10】
アンケート調査のためのプログラムであって、前記プログラムは、プロセッサ部を備えるコンピュータシステムにおいて実行され、前記プログラムは、
アンケート調査のための質問を受信することと、
複数のパーソナライズドAIを用いて、前記質問に対する複数の回答を出力することと、
前記複数のパーソナライズドAIの各々からの出力を集計することと
を前記プロセッサ部に行わせる、プログラム。
【請求項11】
個人の表現を学習したパーソナライズドAIを作成する方法であって、
文章を生成することが可能なモデルを準備することと、
前記モデルに、個人の表現の偏りを是正することなく、前記個人の表現を学習させることと
を含む、方法。
【請求項12】
質問に対して回答を出力可能なパーソナライズドAIを作成する方法であって、
個人が質問に対して回答した結果を取得することと、
文章を生成することが可能な複数のモデルを準備することと、
前記複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成することであって、前記複数のモデルのうちの1つに前記複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成され、前記複数の個人の表現は、少なくとも1人の仮想的な個人の表現を含む、ことと、
前記複数の学習済モデルのそれぞれから前記質問に対する回答を出力することと、
前記複数の学習済モデルから出力された複数の回答と、前記結果とに基づいて、1つの学習済モデルを決定することと
を含む、方法。
【請求項13】
前記複数の個人の表現は、
複数のライフログを取得することと、
前記複数のライフログから複数の個人の表現を抽出することと
によって準備され、前記複数のライフログは、少なくとも1つの仮想的なライフログを含む、請求項12に記載の方法。
【請求項14】
前記少なくとも1つの仮想的なライフログは、少なくとも1つのパーソナライズドAIから生成されている、請求項13に記載の方法。
【請求項15】
前記1つの学習済モデルを決定することは、前記個人が回答した結果に最も近い回答を出力する1つの学習済モデルを決定することを含む、請求項12~14のいずれか一項に記載の方法。
【請求項16】
前記1つの学習済モデルを決定することは、
(1)前記複数の学習済モデルのうちの少なくとも1つから少なくとも1つの仮想的な個人の表現を出力することと、
(2)前記複数のモデルに前記出力された少なくとも1つの仮想的な個人の表現を学習させることにより、少なくとも1つの第2の学習済モデルを生成することであって、前記複数のモデルのうちの1つに1つの仮想的な個人の表現を学習させることにより、1つの第2の学習済モデルが生成される、ことと、
(3)前記少なくとも1つの第2の学習済モデルから前記質問に対する回答を出力することと、
(4)前記複数の学習済モデルから出力された複数の回答と、前記少なくとも1つの第2の学習済モデルから出力された回答と、前記結果とに基づいて、1つの学習済モデルを決定することと
を含む、請求項12~15のいずれか一項に記載の方法。
【請求項17】
前記1つの学習済モデルを決定することは、
所定の条件を満たすまで、前記(1)~前記(3)を繰り返すことであって、前記(1)は、前記少なくとも1つの第2の学習済モデルから少なくとも1つの仮想的な個人の表現を出力することをさらに含み、前記(4)は、
前記複数の学習済モデルおよび前記少なくとも1つの第2の学習済モデルの中から、所定の条件を満たす1つの学習済モデルを特定すること
を含む、請求項16に記載の方法。
【請求項18】
前記所定の条件は、前記複数の学習済モデルから出力された複数の回答および前記少なくとも1つの第2の学習済モデルから出力された回答のうちのいずれか1つと、前記個人が回答した結果との類似度が所定の閾値を超えることを含む、請求項17に記載の方法。
【請求項19】
前記複数のパーソナライズドAIは、請求項11~17に記載の方法に従って作成されたパーソナライズドAIを含む、請求項1~8のいずれか一項に記載のシステム。
【請求項20】
質問に対して回答を出力可能なパーソナライズドAIを作成するためのシステムであって、
個人が質問に対して回答した結果を取得する手段と、
文章を生成することが可能な複数のモデルを準備する手段と、
前記複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成する手段であって、前記複数のモデルのうちの1つに前記複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成され、前記複数の個人の表現は、少なくとも1人の仮想的な個人の表現を含む、手段と、
前記複数の学習済モデルのそれぞれから前記質問に対する回答を出力する手段と、
前記複数の学習済モデルから出力された複数の回答と、前記結果とに基づいて、1つの学習済モデルを決定する手段と
を備えるシステム。
【請求項21】
質問に対して回答を出力可能なパーソナライズドAIを作成するためのプログラムであって、前記プログラムは、プロセッサ部を備えるコンピュータシステムにおいて実行され、前記プログラムは、
個人が質問に対して回答した結果を取得することと、
文章を生成することが可能な複数のモデルを準備することと、
前記複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成することであって、前記複数のモデルのうちの1つに前記複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成され、前記複数の個人の表現は、少なくとも1人の仮想的な個人の表現を含む、ことと、
前記複数の学習済モデルのそれぞれから前記質問に対する回答を出力することと、
前記複数の学習済モデルから出力された複数の回答と、前記結果とに基づいて、1つの学習済モデルを決定することと
を含む処理を前記プロセッサ部に行わせる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アンケート調査のためのシステム、プログラム、および方法に関し、より具体的には、複数のパーソナライズドAIを利用した、アンケート調査のためのシステム、プログラム、および方法に関する。本発明は、さらに、パーソナライズドAIを作成するための方法等にも関する。より具体的には、質問に対して回答を出力可能なパーソナライズドAIを作成する方法等に関する。
【背景技術】
【0002】
従来から、アンケート調査のためには、複数の人物に回答させ、回答を集計するという作業が必要であった。例えば、特許文献1は、アンケート参加メンバーにインターネットを介してアンケートに回答させるシステムを開示している。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、デジタルクローンアンケート調査を実現可能な、アンケート調査のためのシステム等を提供することを目的とする。さらには、本発明は、アンケート調査のためのシステム等に用いることができるパーソナライズドAIを作成するための方法等を提供することを目的とする。
【課題を解決するための手段】
【0005】
一実施形態において、本発明は、例えば、以下の項目を提供する。
(項目1)
アンケート調査のためのシステムであって、
アンケート調査のための質問を受信する受信手段と、
複数のパーソナライズドAIであって、前記複数のパーソナライズドAIの各々は、前記受信された質問に対して回答を出力するように構成されている、複数のパーソナライズドAIと、
前記複数のパーソナライズドAIの各々からの出力を集計する集計手段と
を備えるシステム。
(項目2)
前記複数のパーソナライズドAIの各々は、前記受信された質問に対して回答を出力することを複数回繰り返すことによって複数の回答を出力し、
前記集計手段は、前記複数のパーソナライズドAIの各々から出力された前記複数の回答を集計する、項目1に記載のシステム。
(項目3)
前記複数のパーソナライズドAIの各々は、相互に異なる個人の表現を学習しており、前記複数のパーソナライズドAIの各々は、前記学習した個人の表現に従って、文章を生成することが可能であり、
前記複数のパーソナライズドAIの各々は、前記質問に対する回答として、前記学習した個人の表現に従った文章を出力する、
項目2に記載のシステム。
(項目4)
文章に込められた感情を認識することが可能な感情認識手段をさらに備え、
前記感情認識手段は、
前記複数のパーソナライズドAIの各々から出力された前記複数の回答に込められた複数の感情を認識することと、
前記認識された複数の感情に基づく出力を生成することと
を行うように構成されており、
前記集計手段は、前記複数の感情に基づく出力を集計する、
項目3に記載のシステム、
(項目5)
前記感情認識手段は、
前記複数の感情のうち第1の感情が最も多い場合に第1の出力を生成し、
前記複数の感情のうち第2の感情が最も多い場合に第2の出力を生成する、
項目4に記載のシステム。
(項目6)
前記複数のパーソナライズドAIの各々は、前記個人の表現の偏りを是正することなく、前記個人の表現を学習している、項目3~5のいずれか一項に記載のシステム。
(項目7)
前記個人の表現は、実在する個人による表現である、項目6に記載のシステム。
(項目8)
前記個人の表現は、仮想的な個人による表現である、項目6に記載のシステム。
(項目9)
アンケート調査のための方法であって、
アンケート調査のための質問を受信することと、
複数のパーソナライズドAIを用いて、前記質問に対する複数の回答を出力することと、
前記複数のパーソナライズドAIの各々からの出力を集計することと
を含む方法。
(項目10)
アンケート調査のためのプログラムであって、前記プログラムは、プロセッサ部を備えるコンピュータシステムにおいて実行され、前記プログラムは、
アンケート調査のための質問を受信することと、
複数のパーソナライズドAIを用いて、前記質問に対する複数の回答を出力することと、
前記複数のパーソナライズドAIの各々からの出力を集計することと
を前記プロセッサ部に行わせる、プログラム。
(項目11)
個人の表現を学習したパーソナライズドAIを作成する方法であって、
文章を生成することが可能なモデルを準備することと、
前記モデルに、個人の表現の偏りを是正することなく、前記個人の表現を学習させることと
を含む、方法。
(項目12)
質問に対して回答を出力可能なパーソナライズドAIを作成する方法であって、
個人が質問に対して回答した結果を取得することと、
文章を生成することが可能な複数のモデルを準備することと、
前記複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成することであって、前記複数のモデルのうちの1つに前記複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成され、前記複数の個人の表現は、少なくとも1人の仮想的な個人の表現を含む、ことと、
前記複数の学習済モデルのそれぞれから前記質問に対する回答を出力することと、
前記複数の学習済モデルから出力された複数の回答と、前記結果とに基づいて、1つの学習済モデルを決定することと
を含む、方法。
(項目13)
前記複数の個人の表現は、
複数のライフログを取得することと、
前記複数のライフログから複数の個人の表現を抽出することと
によって準備され、前記複数のライフログは、少なくとも1つの仮想的なライフログを含む、項目12に記載の方法。
(項目14)
前記少なくとも1つの仮想的なライフログは、少なくとも1つのパーソナライズドAIから生成されている、項目13に記載の方法。
(項目15)
前記1つの学習済モデルを決定することは、前記個人が回答した結果に最も近い回答を出力する1つの学習済モデルを決定することを含む、項目12~14のいずれか一項に記載の方法。
(項目16)
前記1つの学習済モデルを決定することは、
(1)前記複数の学習済モデルのうちの少なくとも1つから少なくとも1つの仮想的な個人の表現を出力することと、
(2)前記複数のモデルに前記出力された少なくとも1つの仮想的な個人の表現を学習させることにより、少なくとも1つの第2の学習済モデルを生成することであって、前記複数のモデルのうちの1つに1つの仮想的な個人の表現を学習させることにより、1つの第2の学習済モデルが生成される、ことと、
(3)前記少なくとも1つの第2の学習済モデルから前記質問に対する回答を出力することと、
(4)前記複数の学習済モデルから出力された複数の回答と、前記少なくとも1つの第2の学習済モデルから出力された回答と、前記結果とに基づいて、1つの学習済モデルを決定することと
を含む、項目12~15のいずれか一項に記載の方法。
(項目17)
前記1つの学習済モデルを決定することは、
所定の条件を満たすまで、前記(1)~前記(3)を繰り返すことであって、前記(1)は、前記少なくとも1つの第2の学習済モデルから少なくとも1つの仮想的な個人の表現を出力することをさらに含み、前記(4)は、
前記複数の学習済モデルおよび前記少なくとも1つの第2の学習済モデルの中から、所定の条件を満たす1つの学習済モデルを特定すること
を含む、項目16に記載の方法。
(項目18)
前記所定の条件は、前記複数の学習済モデルから出力された複数の回答および前記少なくとも1つの第2の学習済モデルから出力された回答のうちのいずれか1つと、前記個人が回答した結果との類似度が所定の閾値を超えることを含む、項目17に記載の方法。
(項目19)
前記複数のパーソナライズドAIは、項目11~17に記載の方法に従って作成されたパーソナライズドAIを含む、項目1~8のいずれか一項に記載のシステム。
(項目20)
質問に対して回答を出力可能なパーソナライズドAIを作成するためのシステムであって、
個人が質問に対して回答した結果を取得する手段と、
文章を生成することが可能な複数のモデルを準備する手段と、
前記複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成する手段であって、前記複数のモデルのうちの1つに前記複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成され、前記複数の個人の表現は、少なくとも1人の仮想的な個人の表現を含む、手段と、
前記複数の学習済モデルのそれぞれから前記質問に対する回答を出力する手段と、
前記複数の学習済モデルから出力された複数の回答と、前記結果とに基づいて、1つの学習済モデルを決定する手段と
を備えるシステム。
(項目21)
質問に対して回答を出力可能なパーソナライズドAIを作成するためのプログラムであって、前記プログラムは、プロセッサ部を備えるコンピュータシステムにおいて実行され、前記プログラムは、
個人が質問に対して回答した結果を取得することと、
文章を生成することが可能な複数のモデルを準備することと、
前記複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成することであって、前記複数のモデルのうちの1つに前記複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成され、前記複数の個人の表現は、少なくとも1人の仮想的な個人の表現を含む、ことと、
前記複数の学習済モデルのそれぞれから前記質問に対する回答を出力することと、
前記複数の学習済モデルから出力された複数の回答と、前記結果とに基づいて、1つの学習済モデルを決定することと
を含む処理を前記プロセッサ部に行わせる、プログラム。
【発明の効果】
【0006】
本発明によれば、複数のパーソナライズドAIを利用した、アンケート調査のためのシステム等を提供することができ、これらのシステム等により、デジタルクローンアンケート調査を実現することができる。これにより、複数の人物に回答させる従来のアンケート調査に比べて、高速かつ低価格でアンケート調査を行うことができるようになる。
【図面の簡単な説明】
【0007】
【
図1A】複数の人物にアンケートを回答させる従来のアンケート調査のためのシステムSによる従来のアンケート調査の手法の流れの一例を示す図
【
図1B】本発明によるデジタルクローンアンケート調査の手法の一例を示す図
【
図2A】本発明によるデジタルクローンアンケート調査のためのユーザインターフェースの一例を示す図
【
図2B】本発明によるデジタルクローンアンケート調査のためのユーザインターフェースの一例を示す図
【
図2C】本発明によるデジタルクローンアンケート調査のためのユーザインターフェースの一例を示す図
【
図3】アンケート調査のためのシステム100の構成の一例を示す図
【
図4B】プロセッサ部120の代替実施形態であるプロセッサ部120’の一例を示す図
【
図5】アンケート調査のためのシステム100による処理の一例(処理500)を示すフローチャート
【
図6】処理500におけるステップS502の詳細なフローを示すフローチャート
【
図7】アンケート調査のためのシステム100による処理の別の一例(処理700)を示すフローチャート
【
図8】アンケート調査のためのシステム100による処理の別の一例(処理800)を示すフローチャート
【
図9】実在する個人の情報を利用して、パーソナライズドAIを作成するためのフロー900の一例の概念図
【
図10】実在しない仮想的な個人の情報を利用して、パーソナライズドAIを作成するためのフロー1000の一例の概念図
【
図11】アンケート調査のためのシステム100による処理の別の一例(処理1100)を示すフローチャート
【
図12A】処理1100におけるステップS1105の具体的なステップの一例を示すフローチャート
【
図12B】処理1100におけるステップS1105の具体的なステップの別の一例を示すフローチャート
【発明を実施するための形態】
【0008】
以下、図面を参照しながら、本発明の実施の形態を説明する。
【0009】
1.デジタルクローンアンケート調査
図1Aは、複数の人物にアンケートを回答させる従来のアンケート調査の手法の流れの一例を示す。
図1Aに示される例では、従来のアンケート調査のためのシステムSを利用してアンケート調査が行われることを説明する。
【0010】
ステップS1では、質問者Qが、システムSに質問を入力する。質問者Qは、例えば、自身の情報端末に質問を入力することによって、情報端末を介してシステムSに質問を入力することができる。システムSは、質問を受信すると、複数の回答者R1~RMのそれぞれに質問に対して回答させるために、複数の回答者R1~RMのそれぞれに質問を送信する。本明細書では、「M」、「m」、「N」、「n」等の単一の英文字は、別様に示さない限り、2以上の整数を意味する。
【0011】
ステップS2では、複数の回答者R1~RMのそれぞれが、システムSから質問を受け取る。複数の回答者R1~RMのそれぞれは、例えば、自身の情報端末を介して質問を受信することができる。
【0012】
ステップS3では、複数の回答者R1~RMのそれぞれが、質問に対する回答をシステムSに入力する。複数の回答者R1~RMのそれぞれは、例えば、質問に対する回答を自身の情報端末に入力することによって、情報端末を介してシステムSに回答を入力することができる。
【0013】
システムSは、複数の回答者R1~RMのそれぞれから回答を受信すると、それぞれの回答を集計する。
【0014】
ステップS4では、システムSが、集計された回答を質問者Qに提供する。質問者Qは、例えば、自身の情報端末を介して集計された回答を受信することができる。これにより、質問者Qは、質問に対するアンケート調査の結果を得ることができる。
【0015】
このように、従来のアンケート調査の手法では、各回答者に質問を回答させる必要があり、これは、時間および費用がかかる。特に、回答者の数が増えるほど、結果を得るために必要な時間および費用は大きくなる。
【0016】
本発明の発明者は、従来のアンケート調査に取り代わる新たなアンケート調査の手法を開発した。それは、人間の代わりに質問に対して回答する「デジタルクローン」を利用する、デジタルクローンアンケート調査である。「デジタルクローン」は、個人の情報、例えば、個人の行動や思想を学習することにより、その人らしい活動をすることが可能な「パーソナライズドAI」によって実現され得る。ここで、個人の情報は、実在する人物の情報であってもよいし、実在しない仮想的な人物の情報であってもよい。例えば、実在する人物から得られた情報を学習した「パーソナライズドAI」は、よりその人物らしい活動をすることが可能である。例えば、実在する人物から得られた情報が利用可能でない場合であっても、仮想的な人物の情報を利用することにより、パーソナライズドAIが構築され得る。
【0017】
図1Bは、本発明によるデジタルクローンアンケート調査の手法の一例を示す。
図1Bに示される例では、複数の「パーソナライズドAI」にアンケートを回答させることによって得られた回答を集計し、集計された結果をアンケート調査の結果として質問者に示す。
【0018】
ステップS11では、質問者Qが、システム100に質問を入力する。質問者Qは、例えば、自身の情報端末に質問を入力することによって、情報端末を介してシステム100に質問を入力することができる。
【0019】
ステップS12では、システム100において、複数のパーソナライズドAI PAI1~PAIMのそれぞれに質問を提供する。複数のパーソナライズドAI PAI1~PAIMは、それぞれ異なる個人の情報を学習したAI(人工知能)である。複数のパーソナライズドAI PAI1~PAIMに質問すると、複数のパーソナライズドAI PAI1~PAIMのそれぞれは、その質問に対する回答を出力することができる。
【0020】
ステップS13では、システム100において、複数のパーソナライズドAI PAI1~PAIMのそれぞれが質問に対する回答を出力する。
【0021】
ステップS14では、システム100が、集計された回答を質問者Qに提供する。質問者Qは、例えば、自身の情報端末を介して集計された回答を受信することができる。これにより、質問者Qは、質問に対するアンケート調査の結果を得ることができる。
【0022】
このように、本発明によるデジタルクローンアンケート調査では、複数の回答者の代わりに複数のパーソナライズドAIが質問に対して回答するため、結果を得るために必要な時間および費用を大きく削減することができる。これにより、例えば、アンケート調査に対するハードルを低くすることができ、多種多様な分野におけるアンケート調査の利用が促進される。
【0023】
図2A~
図2Cは、本発明によるデジタルクローンアンケート調査のためのユーザインターフェースの一例を示す。
図2A~
図2Cに示されるユーザインターフェースは、例えば、質問者Qの情報端末の表示部に表示される。
図2A~
図2Cに示されるユーザインターフェースは、例えば、Webアプリケーションによって質問者Qの情報端末に表示される画面であってもよいし、質問者Qの情報端末にインストールされたアプリケーションによって質問者Qの情報端末に表示される画面であってもよい。
【0024】
図2Aは、デジタルクローンアンケート調査のための質問入力画面10の一例を示す。
【0025】
質問入力画面10は、質問入力部11と、調査詳細設定ボタン12と、見積額表示部13と、ASKボタン14とを備えている。
【0026】
質問者Qは、質問入力部11に質問を入力することができる。質問の入力の仕方は問わない。例えば、キーボード等を介してテキストベースで質問を入力するようにしてもよいし、マイク等を介して音声ベースで質問を入力するようにしてもよい。
【0027】
調査詳細設定ボタン12は、アンケート調査のための詳細を設定するときに選択されるボタンであり、調査詳細設定ボタン12が選択されると、
図1Bに示される調査詳細設定部15が展開される。
【0028】
見積額表示部13には、アンケート調査のための見積額が表示される。見積額は、例えば、アンケート調査のための詳細に応じて変動し得る。
【0029】
ASKボタン14は、アンケート調査を開始するためのボタンであり、ASKボタン14が選択されると、デジタルクローンアンケート調査が開始され、デジタルクローンアンケート調査が完了した後、
図2Cの結果表示画面20に遷移する。
【0030】
図2Bは、調査詳細設定部15が展開された質問入力画面10の一例を示す。
【0031】
質問者Qは、調査詳細設定部15に調査の詳細を入力することができる。質問の入力の仕方は問わない。例えば、キーボード等を介してテキストベースで調査の詳細を入力するようにしてもよいし、マイク等を介して音声ベースで調査の詳細を入力するようにしてもよいし、複数の選択肢の中から調査の詳細を選択するようにしてもよい。
図2Bに示される例では、調査のための詳細として、アンケート調査の対象者のサンプル数、アンケート調査の精度、アンケート調査の対象者の性別、アンケート調査の対象者の年齢を設定することができる。他の任意の事項を調査のための詳細として設定することができる。
【0032】
図2Cは、デジタルクローンアンケート調査による回答表示画面20の一例を示す。
【0033】
結果表示画面20には、デジタルクローンアンケート調査による結果が表示される。結果表示画面20は、条件表示部21と、結果表示部22と、所要時間表示部23と、グラフ表示部24と、Next Questionボタン25とを備えている。
【0034】
条件表示部21には、デジタルクローンアンケート調査が行われた条件が表示される。
図2Cに示される例では、1万人の20~25歳の女性を対象としたアンケート調査であったため、その条件が条件表示部21に表示されている。
【0035】
回答表示部22には、デジタルクローンアンケート調査の結果がテキストで表示される。
図2Cに示される例では、「次期大統領選で、○○氏を支持しますか?」という質問に対して、4000人が支持すると回答し、6000人が支持しないと回答したという結果が表示されている。
【0036】
所要時間表示部23には、デジタルクローンアンケート調査のために要した時間が表示される。
図2Cに示される例では。所要時間が100秒であったことが表示されている。
【0037】
グラフ表示部24には、デジタルクローンアンケート調査の結果がグラフで表示される。
図2Cに示される例では、円グラフで、デジタルクローンアンケート調査の結果が表示されている。グラフ表示部24には、他の任意の形式のグラフで、デジタルクローンアンケート調査の結果を表示することができる。
【0038】
Next Questionボタン25は、次の質問でのデジタルクローンアンケート調査に進むためのボタンである。例えば、Next Questionボタン25が選択されると、質問入力画面10に遷移する。
【0039】
このように、質問者Qは、アンケート調査のための質問を質問入力画面10に入力するだけで、その質問に対するアンケート調査の結果を得ることができる。
【0040】
上述したシステム100は、後述するアンケート調査のためのシステムによって達成され得る。アンケート調査のためのシステムは、複数のパーソナライズドAIを利用する。
【0041】
2.アンケート調査のためのシステムの構成
図3は、アンケート調査のためのシステム100の構成の一例を示す。
【0042】
システム100は、データベース部200に接続されている。また、システム100は、少なくとも1つの端末装置300にネットワーク400を介して接続されている。
【0043】
なお、
図3では、3つの端末装置300が示されているが、端末装置300の数はこれに限定されない。任意の数の端末装置300が、ネットワーク400を介してシステム100に接続され得る。
【0044】
ネットワーク400は、任意の種類のネットワークであり得る。ネットワーク400は、例えば、インターネットであってもよいし、LANであってもよい。ネットワーク400は、有線ネットワークであってもよいし、無線ネットワークであってもよい。
【0045】
システム100の一例は、デジタルクローンアンケート調査のためサービスを提供するサービスプロバイダに設置されているコンピュータ(例えば、サーバ装置)であるが、これに限定されない。端末装置300の一例は、質問者が利用するコンピュータ(例えば、端末装置)であるが、これに限定されない。ここで、コンピュータ(サーバ装置または端末装置)は、任意のタイプのコンピュータであり得る。例えば、端末装置は、スマートフォン、タブレット、パーソナルコンピュータ、スマートグラス、スマートウォッチ等の任意のタイプの端末装置であり得る。
【0046】
システム100は、インターフェース部110と、プロセッサ部120と、メモリ130部とを備える。
【0047】
インターフェース部110は、システム100の外部と情報のやり取りを行う。システム100のプロセッサ部120は、インターフェース部110を介して、システム100の外部から情報を受信することが可能であり、システム100の外部に情報を送信することが可能である。インターフェース部110は、任意の形式で情報のやり取りを行うことができる。
【0048】
インターフェース部110は、例えば、システム100に情報を入力することを可能にする入力部を備える。入力部が、どのような態様でシステム100に情報を入力することを可能にするかは問わない。例えば、入力部がタッチパネルである場合には、ユーザがタッチパネルにタッチすることによって情報を入力するようにしてもよい。あるいは、入力部がマウスである場合には、ユーザがマウスを操作することによって情報を入力するようにしてもよい。あるいは、入力部がキーボードである場合には、ユーザがキーボードのキーを押下することによって情報を入力するようにしてもよい。あるいは、入力部がマイクである場合には、ユーザがマイクに音声を入力することによって情報を入力するようにしてもよい。あるいは、入力部がカメラである場合には、カメラが撮像した情報を入力するようにしてもよい。あるいは、入力部がデータ読み取り装置である場合には、システム100に接続された記憶媒体から情報を読み取ることによって情報を入力するようにしてもよい。あるいは、入力部が受信器である場合、受信器がネットワークを介してシステム100の外部から情報を受信することにより入力してもよい。この場合、ネットワークの種類は問わない。例えば、受信器は、インターネットを介して情報を受信してもよいし、LANを介して情報を受信してもよい。
【0049】
例えば、インターフェース部110の入力部は、端末装置からアンケート調査のための質問を受信し得る。アンケート調査のための質問は、例えば、テキストベースの質問であってもよいし、音声ベースの質問であってもよい。
【0050】
例えば、インターフェース部110の入力部は、過去に行われたアンケート調査の結果を受信し得る。過去に行われたアンケート調査の結果は、例えば、端末装置から受信されてもよいし、データベース部200から受信されてもよいし、他の場所から受信されてもよい。過去に行われたアンケート調査は、例えば、多肢選択式のアンケート調査であってもよいし、記述式または論述式のアンケート調査であってもよい。
【0051】
インターフェース部110は、例えば、システム100から情報を出力することを可能にする出力部を備える。出力部が、どのような態様でシステム100から情報を出力することを可能にするかは問わない。例えば、出力部が表示画面である場合、表示画面に情報を出力するようにしてもよい。あるいは、出力部がスピーカである場合には、スピーカからの音声によって情報を出力するようにしてもよい。あるいは、出力部がデータ書き込み装置である場合、システム100に接続された記憶媒体に情報を書き込むことによって情報を出力するようにしてもよい。あるいは、出力部が送信器である場合、送信器がネットワークを介してシステム100の外部に情報を送信することにより出力してもよい。この場合、ネットワークの種類は問わない。例えば、送信器は、インターネットを介して情報を送信してもよいし、LANを介して情報を送信してもよい。
【0052】
例えば、インターフェース部110の出力部は、端末装置に、アンケート調査の結果を送信し得る。
【0053】
プロセッサ部120は、システム100の処理を実行し、かつ、システム100全体の動作を制御する。プロセッサ部120は、メモリ部130に格納されているプログラムを読み出し、そのプログラムを実行する。これにより、システム100を所望のステップを実行するシステムとして機能させることが可能である。プロセッサ部120は、単一のプロセッサによって実装されてもよいし、複数のプロセッサによって実装されてもよい。
【0054】
メモリ部130は、システム100の処理を実行するために必要とされるプログラムやそのプログラムの実行に必要とされるデータ等を格納する。メモリ部130は、アンケート調査のための処理をプロセッサ部120に行わせるためのプログラム(例えば、後述する
図5~7に示される処理を実現するプログラム)および/またはパーソナライズドAIを作成するための処理をプロセッサ部120に行わせるためのプログラム(例えば、後述する
図8、
図11、
図12A、
図12Bに示される処理を実現するプログラム)を格納してもよい。ここで、プログラムをどのようにしてメモリ部130に格納するかは問わない。例えば、プログラムは、メモリ部130にプリインストールされていてもよい。あるいは、プログラムは、ネットワークを経由してダウンロードされることによってメモリ部130にインストールされるようにしてもよい。この場合、ネットワークの種類は問わない。メモリ部130は、任意の記憶手段によって実装され得る。
【0055】
データベース部200には、例えば、パーソナライズドAIを作成するためのデータが格納される。パーソナライズドAIは、個人の情報を学習することにより、その人らしい活動をすることが可能なAIである。例えば、パーソナライズドAIは、個人の表現を学習し、その個人の表現に従って文章を生成することが可能なパーソナライズド文章生成モデルであり得る。例えば、データベース部200には、パーソナライズドAIを作成するためのデータとして、プロンプト(文章の書き出し)を入力すると、その続きの文章を生成することが可能な文章生成モデルと、個人の表現を学習するためのアルゴリズムと、学習に用いられる個人の表現とが格納され得る。ここで、個人の情報は、実在する人物の情報であってもよいし、実在しない仮想的な人物の情報であってもよい。個人の情報が仮想的な人物の情報である場合、個人の情報は、人間が理解可能な情報である必要はない。仮想的な人物の情報は、例えば、意味を持たない文字または記号の羅列であってもよい。学習に用いられる個人の情報は、例えば、ライフログに含まれる情報であり得る。ライフログは、実在する人物のライフログであってもよいし、仮想的な人物の仮想的なライフログであってもよい。
【0056】
あるいは、データベース部200には、例えば、作成されたパーソナライズドAI(例えば、個人の情報を学習した学習済のモデル)が格納される。
【0057】
図2に示される例では、データベース部200は、システム100の外部に設けられているが、本発明はこれに限定されない。データベース部200をシステム100の内部に設けることも可能である。このとき、データベース部200は、メモリ部130を実装する記憶手段と同一の記憶手段によって実装されてもよいし、メモリ部130を実装する記憶手段とは別の記憶手段によって実装されてもよい。いずれにせよ、データベース部200は、システム100のための格納部として構成される。データベース部200の構成は、特定のハードウェア構成に限定されない。例えば、データベース部200は、単一のハードウェア部品で構成されてもよいし、複数のハードウェア部品で構成されてもよい。例えば、データベース部200は、システム100の外付けハードディスク装置として構成されてもよいし、ネットワークを介して接続されるクラウド上のストレージとして構成されてもよい。
【0058】
【0059】
プロセッサ部120は、受信手段121と、回答生成手段122と、集計手段123とを備える。
【0060】
受信手段121は、アンケート調査のための質問を受信するように構成されている。受信手段121は、例えば、インターフェース部110を介してシステム100の外部から受信されたアンケート調査のための質問をインターフェース部110から受信する。アンケート調査のための質問は、例えば、テキストベースの質問であってもよいし、音声ベースの質問であってもよい。
【0061】
受信されたアンケート調査のための質問は、後続の手段によって処理可能な形式に変換されるようにしてもよい。例えば、アンケート調査のための質問が音声ベースの質問である場合には、テキストベースの質問に変換するようにしてもよい。
【0062】
回答生成手段122は、複数のパーソナライズドAI PAI1~PAIMを用いて、アンケート調査のための質問に対する複数の回答を生成するように構成されている。複数のパーソナライズドAI PAI1~PAIMの各々は、質問に対する回答を出力するように構成されている。回答生成手段122によって生成された複数の回答の各々は、複数のパーソナライズドAI PAI1~PAIMの各々から出力された回答に対応し得る。
【0063】
複数のパーソナライズドAI PAI1~PAIMの各々は、相互に異なる個人の情報を学習している。これにより、パーソナライズドAI PAI1~PAIMの各々は、その人らしい活動をすることが可能である。例えば、パーソナライズドAI PAIMは、入力された質問に対して、その人らしい回答を出力することができる。回答は、例えば、テキストベースでの回答であってもよいし、音声ベースの回答であってもよい。
【0064】
例えば、複数のパーソナライズドAI PAI1~PAIMの各々は、個人の表現を学習し、その個人の表現に従って文章を生成することが可能なパーソナライズド文章生成モデルであり得る。この場合、複数のパーソナライズドAI PAI1~PAIMの各々は、入力された質問に対して、学習した個人の表現に従った文章で回答を生成することができる。本発明の発明者は、個人の表現には、個人の思想または感情が反映されているため、パーソナライズド文章生成モデルによって生成された回答には、個人の思想または感情が反映されているとみなすことができると考えた。パーソナライズド文章生成モデルによって生成された回答をアンケート調査に利用することにより、個人の思想または感情を反映させた、精度の高いアンケート調査結果を得ることができる。
【0065】
例えば、パーソナライズド文章生成モデルは、個人の情報を大量に学習させることによって一から作成されたモデルであってもよいし、汎用の文章生成モデルを個人の情報でファインチューニングすることによって作成されたモデルであってもよい。好ましくは、パーソナライズド文章生成モデルは、汎用の文章生成モデルを個人の情報でファインチューニングすることによって作成されたモデルであり得る。ファインチューニングすることによってパーソナライズド文章生成モデルを作成することは、ファインチューニングのために必要な学習データ量を、一からモデルを作成する場合よりもはるかに少なくすることができ、かつ、ファインチューニングのために必要なコスト(時間およびメモリ)を、一からモデルを作成する場合よりもはるかに小さくすることができるからである。
【0066】
一例において、パーソナライズド文章生成モデルは、OpenAIによって開発された汎用の文章生成モデルGPT-2modelを個人の情報でファインチューニングすることによって作成され得る。GPT-2modelは、プロンプト(文章の書き出し)を与えると、その続きの文章を生成することができるモデルである。現在、GPT-2modelは、英語、中国語、イタリア語、韓国語等の言語で利用可能である。利用可能な言語以外の言語、例えば、日本語でのモデルを作成する場合には、その言語の文章でGPT-2modelを訓練することによって、その言語で文章を生成することが可能な文章生成モデルを作成し、作成された文章生成モデルを個人の情報でファインチューニングすることによって、パーソナライズド文章生成モデルを作成することができる。なお、GPT-2modelは一例であり、本発明は、GPT-2modelをベースにしたパーソナライズド文章生成モデルに限定されない。パーソナライズド文章生成モデルは、例えば、用途または性能に応じて、他のモデルをベースにして作成することが可能である。
【0067】
パーソナライズドAIを作成するために、個人の種々の情報を利用することができる。ここで、個人の情報は、実在する人物の情報であってもよいし、実在しない仮想的な人物の情報であってもよい。個人の情報が実在する人物の情報である場合、個人の情報は、例えば、実在する個人によって作成された文章(例えば、メール、チャット、SNSへの投稿)を含むが、これに限定されない。例えば、個人の情報は、例えば、実在する個人の行動を撮影した映像、実在する個人が発話した音声等を含むようにしてもよい。個人の情報が実在しない人物の情報である場合、個人の情報は、例えば、仮想的に作成された文章、仮想的に作成された映像、仮想的に作成された音声等を含み得る。パーソナライズドAIを作成するために利用される個人の情報は、個人の感情が含まれていることが好ましい。これにより、パーソナライズドAIは、個人の感情を反映させた回答を生成することができるようになるからである。
【0068】
通常、学習素材を学習させる際には、機械学習の偏りを防ぐために、偏りの無い学習素材を作成する必要がある。学習素材に偏りがあると、学習済モデルは、偏りのある結果を出力するからである。パーソナライズドAIを作成するために個人の情報を学習させる際には、通常の機械学習とは異なり、個人の情報の偏りを是正することなく、個人の情報を学習させる。作成されたパーソナライズドAIは、偏りのある結果を出力することになるが、この「偏り」こそが「個性」であるとみなすことができるのである。このようにして、パーソナライズドAIは、「個性」を含んだ出力を提供することができるようになる。
【0069】
複数のパーソナライズドAI PAI1~PAIMの各々は、例えば、1つの質問を入力されると、1つの回答を生成することができる。これを複数回繰り返すことにより、複数のパーソナライズドAI PAI1~PAIMの各々は、複数の回答を出力することができる。各パーソナライズドAIによる出力は、必ずしも正確に質問に対して回答しているわけではない。各パーソナライズドAIから複数の回答を出力することにより、各パーソナライズドAIから統計的に正確な回答を生成することができる。繰り返しの回数は、例えば、5回以上、10回以上、50回以上、100回以上、1000回以上、10000回以上等の任意の回数であり得る。繰り返しの回数は、回答の精度に応じて変更することができる。精度を高める場合には、繰り返しの回数を多くする(例えば、100回以上)ことができる。
【0070】
集計手段123は、複数の回答を集計するように構成されている。集計手段123は、任意の手法で複数の回答を集計することができる。集計手段123は、例えば、複数の回答のうちの第1の回答(例えば、Yesという回答)の数および第2の回答(例えば、Noという回答)の数を計算するようにしてもよいし、複数の回答のうちの第1の回答(例えば、Yesという回答)の割合および第2の回答の割合(例えば、Noという回答)を計算するようにしてもよい。
【0071】
例えば、集計手段123は、複数のパーソナライズドAI PAI1~PAIMの各々からのそれぞれの回答を集計することができる。例えば、集計手段123は、1つのパーソナライズドAIからの1個の回答をそのパーソナライズドAIからの回答として、M個のパーソナライズドAI PAI1~PAIMの各々からの回答(すなわち、M個の回答)を集計することができる。例えば、集計手段123は、1つのパーソナライズドAIからのN個の回答をそのパーソナライズドAIからの回答として、M個のパーソナライズドAI PAI1~PAIMの各々からの回答(すなわち、N×M個の回答)を集計することができる。
【0072】
例えば、集計手段123は、複数のパーソナライズドAI PAI1~PAIMの各々からの回答文章を複数のカテゴリのうちの1つに分類することにより、集計することができる。複数のカテゴリは、例えば、ポジティブな回答、ネガティブな回答等を含むが、これらに限定されない。集計手段123は、例えば、自然言語処理を利用して複数のパーソナライズドAI PAI1~PAIMの各々からの回答文章を複数のカテゴリのうちの1つに分類することができる。
【0073】
集計手段123による出力は、インターフェース部110を介してシステム100の外部に出力される。
【0074】
図4Bは、プロセッサ部120の代替実施形態であるプロセッサ部120’の一例を示す。プロセッサ部120’は、プロセッサ部120’が感情認識手段124を備えている点で、プロセッサ部120と異なっている。
図4Bでは、
図4Aを参照して説明した構成要素と同じ構成要素には同じ参照番号を付し、ここでは、それらの構成要素についての説明を省略する。
【0075】
プロセッサ部120’は、受信手段121と、回答生成手段122と、感情認識手段124と、集計手段123とを備える。
【0076】
感情認識手段124は、文章に込められた感情を認識することが可能なように構成されている。感情認識手段124は、文章に込められた感情を認識することが可能な任意の公知の感情解析エンジンによって達成され得る。
【0077】
感情認識手段124は、例えば、入力された文章に込められた感情を複数の分類に分類する感情分類器(Intent Classifier)であり得る。複数の分類は、任意の数の分類であり得る。例えば、複数の分類は、ネガティブ/ポジティブ、または、優しい/厳しい等の2つの分類であってもよいし、喜び/怒り/悲しみ等の3つの分類であってもよいし、喜/怒/哀/楽等の4つの分類であってもよいし、4よりも多い分類、例えば、100分類であってもよい。
【0078】
感情分類器は、機械学習を利用して、文章に含まれている感情を複数の分類に分類することができる。感情分類器は、任意の機械学習手法を用いて作成されることができる。感情分類器を作成するための機械学習手法は、例えば、決定木、サポートベクターマシン、または、深層ニューラルネットワーク等であり得る。感情分類器は、例えば、教師あり学習によって作成され得る。
【0079】
感情分類器を作成するための学習データとして、例えば、感情を表現している文章を利用することができる。感情を表現している文章には、どの分類の感情を表現しているかを示すラベルを付しておく。例えば、感情を表現している文章を入力用教師データとし、その文章のラベルを出力用教師データとして学習させることにより、感情分類器を作成することができる。感情を表現している文章は、例えば、ベクトルとして表現したうえで、入力用教師データとして利用されることができる。例えば、単語袋モデル(bag-of-words model)を用いる手法、文脈的単語の意味表現ベクトル(contextualized word embedding)を用いる手法(例えばBERT、ElMo等)、MUSE(Multilingual Universal Sentence Encoding:https://arxiv.org/abs/1907.04307)によって、文章をベクトルとして表現することができる。
【0080】
例えば、文章が表現する感情がポジティブまたはネガティブのいずれであるかを出力する感情分類器を作成する場合、ネガティブな感情を表現している文章、およびポジティブな感情を表現している文章を学習することになる。ネガティブな感情を表現している第1の文章、ポジティブな感情を表現している第2の文章、・・・等を学習する場合の入力用教師データと出力用教師データとの組は、(第1の文章のベクトル表現,ネガティブ)、(第2の文章のベクトル表現,ポジティブ)、・・・等であり得る。このようにして学習された感情分類器に、或る文章のベクトル表現を入力すると、その文章が表現する感情がポジティブまたはネガティブのいずれであるかを出力することができるようになる。
【0081】
例えば、文章が表現する感情が喜びまたは怒りまたは悲しみのいずれであるかを出力する感情分類器を作成する場合、喜びの感情を表現している文章、怒りの感情を表現している文章、および悲しみの感情を表現している文章を学習することになる。喜びの感情を表現している第1の文章、怒りの感情を表現している第2の文章、悲しみの感情を表現している第3の文章、・・・等を学習する場合の入力用教師データと出力用教師データとの組は、(第1の文章のベクトル表現,喜び)、(第2の文章のベクトル表現,怒り)、(第3の文章のベクトル表現,悲しみ)、・・・等であり得る。このようにして学習された感情分類器に、或る文章のベクトル表現を入力すると、その文章が表現する感情が喜びまたは怒りまたは悲しみのいずれであるかを出力することができるようになる。
【0082】
感情認識手段124は、複数のパーソナライズドAI PAI1~PAIMの各々からのそれぞれの回答に込められた感情を認識することができる。感情認識手段124は、例えば、1つのパーソナライズドAIからの1つの回答に込められた感情を認識することにより、その1つの感情をそのパーソナライズドAIからの回答に込められた感情として認識することができる。あるいは、感情認識手段124は、例えば、1つのパーソナライズドAIからの複数の回答のそれぞれに込められた感情を認識することにより、その複数の感情をそのパーソナライズドAIからの回答に込められた感情として認識することができる。あるいは、感情認識手段124は、例えば、1つのパーソナライズドAIからの複数の回答のそれぞれに込められた感情を認識し、複数の感情のうちのいくつかの感情をそのパーソナライズドAIからの回答に込められた感情として認識することができる。複数の感情のうちのいくつか感情は、例えば、複数の感情のうち、認識された数が多い上位いくつかの感情、認識された数が所定数以上の感情等であり得る。あるいは、感情認識手段124は、例えば、1つのパーソナライズドAIからの複数の回答のそれぞれに込められた感情を認識し、複数の感情のうちの1つの感情をそのパーソナライズドAIからの回答に込められた感情として認識することができる。複数の感情のうちの1つの感情は、例えば、複数の感情のうち、認識された数が最も多い感情であり得る。
【0083】
感情認識手段124は、例えば、認識された感情に基づく出力を生成することができる。出力は、例えば、認識された感情が何であるかを示す出力であってもよいし、パーソナライズドAIからの回答が何であるかを示す出力であってもよい。出力は、例えば、認識された複数の感情のうちの各感情の割合を示す出力であってもよい。例えば、感情認識手段124は、認識された複数の感情のうち第1の感情が最も多い場合に第1の出力を生成し、認識された複数の感情のうち第2の感情が最も多い場合に第2の出力を生成することができる。一例において、感情認識手段124は、複数の感情のうちポジティブな感情が最も多い場合に第1の出力(例えば、認識された感情がポジティブであることを示す出力、または、パーソナライズドAIからの回答がYesであることを示す出力)を生成し、複数の感情のうちネガティブな感情が最も多い場合に第2の出力(例えば、認識された感情がネガティブであることを示す出力、または、パーソナライズドAIからの回答がNoであることを示す出力)を生成することができる。一例において、感情認識手段124は、複数の感情のうちポジティブな感情が60%であり、ネガティブな感情が40%である場合に、(ポジティブ60%,ネガティブ40%)を示す出力を生成することができる。
【0084】
このように、感情認識手段124は、M個のパーソナライズドAIの各々からのそれぞれ1つの回答(すなわち、計M個の回答)からM個の感情を認識し、認識された感情に基づく出力を生成するようにしてもよいし、M個のパーソナライズドAIの各々からのそれぞれN個の回答(すなわち、M×N個の回答)からM×N個の感情を認識し、認識された感情に基づく出力を生成するようにしてもよいし、M個のパーソナライズドAIの各々からのそれぞれN個の回答(すなわち、M×N個の回答)からM×n個の感情を認識し、認識された感情に基づく出力を生成するようにしてもよい(N>n)。
【0085】
集計手段123は、感情認識手段124による出力を集計することができる。集計手段123は、例えば、感情認識手段124による出力が示す感情を集計するようにしてもよいし、感情認識手段124による出力が示す感情を質問に対する回答に対応付けて集計するようにしてもよい。集計手段123は、例えば、感情認識手段124による出力が示すパーソナライズドAIからの回答を集計することができる。
【0086】
例えば、集計手段123は、複数の感情のうちの第1の感情(例えば、ポジティブな感情)の数および第2の感情(例えば、ネガティブな感情)の数を計算するようにしてもよいし、複数の感情のうちの第1の感情(例えば、ポジティブな感情)の割合および第2の感情(例えば、ネガティブな感情)を計算するようにしてもよい。例えば、集計手段123は、複数の感情のうちの第1の感情(例えば、ポジティブな感情)を第1の回答(例えば、Yesの回答)に対応付け、第2の感情(例えば、ネガティブな感情)を第2の回答(例えば、Noの回答)に対応付けて、それらの数または割合を計算するようにしてもよい
【0087】
集計手段123による出力は、インターフェース部110を介してシステム100の外部に出力される。
【0088】
上述した
図4Aおよび
図4Bに示される例では、プロセッサ部120、120’の各構成要素が同一のプロセッサ部120、120’内に設けられているが、本発明はこれに限定されない。プロセッサ部120、120’の各構成要素が複数のプロセッサ部に分散される構成も本発明の範囲内である。このとき、複数のプロセッサ部は、同一のハードウェア部品内に位置してもよいし、近傍または遠隔の別個のハードウェア部品内に位置してもよい。
【0089】
なお、上述したシステム100の各構成要素は、単一のハードウェア部品で構成されていてもよいし、複数のハードウェア部品で構成されていてもよい。複数のハードウェア部品で構成される場合は、各ハードウェア部品が接続される態様は問わない。各ハードウェア部品は、無線で接続されてもよいし、有線で接続されてもよい。本発明のシステム100は、特定のハードウェア構成には限定されない。プロセッサ部120、120’をデジタル回路ではなくアナログ回路によって構成することも本発明の範囲内である。本発明のシステム100の構成は、その機能を実現できる限りにおいて上述したものに限定されない。
【0090】
3.アンケート調査のためのシステムによる処理
図5は、アンケート調査のためのシステム100による処理の一例(処理500)を示すフローチャートである。処理500は、システム100のプロセッサ部120において行われ得る。
【0091】
ステップS501では、プロセッサ部120の受信手段121が、アンケート調査のための質問を受信する。受信手段121は、例えば、インターフェース部110を介してシステム100の外部から受信されたアンケート調査のための質問をインターフェース部110から受信する。
【0092】
ステップS502では、プロセッサ部120の回答生成手段122が、複数のパーソナライズドAIを用いて、ステップS501で受信された質問に対する複数の回答を出力する。回答生成手段122は、例えば、M個のパーソナライズドAIを用いてM個の回答を生成するようにしてもよいし、M個のパーソナライズドAIのそれぞれからN個の回答を生成することにより、M×N個の回答またはM×n個の回答を生成するようにしてもよい(N>n)。
【0093】
複数のパーソナライズドAIの各々は、相互に異なる個人の情報を学習している。これにより、複数のパーソナライズドAIの各々は、入力された質問に対して、その人らしい回答を出力することができる。複数のパーソナライズドAIの各々は、例えば、個人の表現を学習し、その個人の表現に従って文章を生成することが可能なパーソナライズド文章生成モデルであり得る。このとき、複数のパーソナライズドAI PAI1~PAIMの各々は、入力された質問に対して、学習した個人の表現に従った文章で回答を生成することができる。
【0094】
例えば、パーソナライズド文章生成モデルであるパーソナライズドAIは、プロンプト(文章の書き出し)を与えると、学習した個人の表現に従って、その続きの文章を生成することができるため、質問に関連するプロンプトをパーソナライズドAIに入力することにより、質問の回答を得ることができる。質問に関連するプロンプトは、例えば、質問の種類に応じて予め設定されたテンプレートから選択されるようにしてもよいし、質問に基づいて作成されるようにしてもよいし、質問者によって設定されるようにしてもよいし、アンケート調査のサービスのサービスプロバイダによって設定されるようにしてもよい。質問に関連するプロンプトが質問に基づいて作成される場合には、例えば、予め設定されたテンプレートに基づいてプロンプトを作成するようにしてもよいし、機械学習を利用してプロンプトを生成するようにしてもよい。
【0095】
パーソナライズドAIは、学習した個人の表現に従って、これらのプロンプトの続きの文章を生成することができる。生成された文章が、質問に対する回答となる。
【0096】
ステップS503では、プロセッサ部120の集計手段123が、複数のパーソナライズドAIの各々からの出力を集計する。例えば、集計手段123は、1つのパーソナライズドAIからの1個の回答をそのパーソナライズドAIからの回答として、M個のパーソナライズドAI PAI1~PAIMの各々からの回答(すなわち、M個の回答)を集計することができる。例えば、集計手段123は、1つのパーソナライズドAIからのN個の回答をそのパーソナライズドAIからの回答として、M個のパーソナライズドAI PAI1~PAIMの各々からの回答(すなわち、N×M個の回答)を集計することができる。集計手段123は、例えば、複数の回答のうちの第1の回答(例えば、Yesという回答)の数および第2の回答(例えば、Noという回答)の数を計算するようにしてもよいし、複数の回答のうちの第1の回答(例えば、Yesという回答)の割合および第2の回答の割合(例えば、Noという回答)を計算するようにしてもよい。
【0097】
処理500により、アンケート調査のための質問に対する回答を複数のパーソナライズドAIの各々から得ることができる。これにより、複数の人物にアンケートを回答させる従来のアンケート調査に比べて、高速かつ低価格でアンケート調査を行うことができる。
【0098】
図6は、処理500におけるステップS502の詳細なフローを示す。
図6では、M個のパーソナライズドAIの各々からN個の回答を取得するためのステップを説明する。各ステップにおける下付き文字
Mは、第MのパーソナライズドAIを用いた処理であることを示している。ここで、Nは2以上の任意の整数であり、例えば、5、10、50、100、1000、10000等の任意の整数であり得る。Nは、アンケート調査の回答の精度に応じて変更することができる。精度を高める場合には、Nを大きくする(例えば、100以上)ことができる。
【0099】
ステップS6011では、変数n=1が定義される。
【0100】
ステップS6021では、第1のパーソナライズドAIに、ステップS501で受信された質問が入力される。
【0101】
ステップS6031では、第1のパーソナライズドAIから第nの回答を出力する。ここでは、第1の回答が出力される。第1のパーソナライズドAIは、例えば、第1の人物の情報を学習しており、第1の人物のようにふるまうことができる。従って、第1のパーソナライズドAIは、入力された質問に対して、あたかも第1の人物が回答したかのような回答を出力することができる。例えば、第1のパーソナライズドAIは、第1の人物の表現を学習しており、入力された質問に対する回答として、第1の人物の表現に従った文章を生成して出力することができる。出力された回答は、例えば、メモリ等に格納される。
【0102】
ステップS6041では、変数nがインクリメントされる。
【0103】
ステップS6051では、変数nがNと比較される。変数nがN以上である場合、第1のパーソナライズドAIを用いた処理を完了することができる。変数nがNより小さい場合、ステップS6021に戻り、変数nがN以上になるまでステップS6021~ステップS6051を繰り返す。これにより、第1のパーソナライズドAIからN個の回答を得ることができる。
【0104】
第1のパーソナライズドAIを用いた処理(ステップS6011~ステップS6051)の前、後、または同時に、第2のパーソナライズドAIを用いた処理(ステップS6012~ステップS6052)、第3のパーソナライズドAIを用いた処理(ステップS6013~ステップS6053)、・・・第MのパーソナライズドAIを用いた処理(ステップS601M~ステップS605M)を行うことができる。これにより、M個のパーソナライズドAIの各々からN個の回答を得ることができる。すなわち、計M×N個の回答を得ることができる。
【0105】
M個のパーソナライズドAIの全てから回答が得られると、ステップS503に進むことができる。
【0106】
各パーソナライズドAIによる出力は、必ずしも正確に質問に対して回答しているわけではない。ステップS502において、各パーソナライズドAIから複数の回答を出力することにより、各パーソナライズドAIから統計的に正確な回答を生成することができる。これにより、アンケート調査の精度が向上する。
【0107】
図7は、アンケート調査のためのシステム100による処理の別の一例(処理700)を示すフローチャートである。処理700は、システム100のプロセッサ部120’において行われ得る。
【0108】
ステップS701では、プロセッサ部120’の受信手段121が、アンケート調査のための質問を受信する。ステップS701は、上述したステップS501と同様であり、説明を省略する。
【0109】
ステップS702では、プロセッサ部120’の回答生成手段122が、複数のパーソナライズドAIを用いて、ステップS501で受信された質問に対する複数の回答を出力する。回答生成手段122は、例えば、文章の形式で、回答を出力することができる。ステップS702は、上述したステップS502と同様であり、説明を省略する。
【0110】
ステップS703では、プロセッサ部120’の感情認識手段124が、複数のパーソナライズドAIの各々から出力された回答に込められた感情を認識する。感情認識手段124は、例えば、文章に込められた感情を複数の分類に分類する感情分類器であり得、複数のパーソナライズドAIの各々から出力された回答に込められた感情を複数の分類のうちの1つに分類することによって、感情を認識することができる。複数の分類は、任意の数の分類であり得る。例えば、複数の分類は、ネガティブ/ポジティブ、または、優しい/厳しい等の2つの分類であってもよいし、喜び/怒り/悲しみ等の3つの分類であってもよいし、喜/怒/哀/楽等の4つの分類であってもよいし、4よりも多い分類、例えば、100分類であってもよい。
【0111】
感情分類器は、例えば、機械学習を利用して、文章に込められた感情を複数の分類に分類することができる。複数のパーソナライズドAIの各々から出力された文章を感情分類器に入力すると、複数のパーソナライズドAIの各々から出力された文章に込められた感情を出力することができる。例えば、第1のパーソナライズドAIから出力された第1の回答の文章を感情分類器に入力すると、第1の回答の文章に込められた感情を出力し、第1のパーソナライズドAIから出力された第2の回答の文章を感情分類器に入力すると、第2の回答の文章に込められた感情を出力することができ、・・・第Nの回答を感情分類器に入力すると、第Nの回答の文章に込められた感情を出力することができる。このようにして、第1のパーソナライズドAIの出力からN個の感情を認識することができる。例えば、第1のパーソナライズドAIから出力された文章を感情分類器に入力すると、第1のパーソナライズドAIから出力された文章に込められた感情を出力し、第2のパーソナライズドAIから出力された文章を感情分類器に入力すると、第2のパーソナライズドAIから出力された文章に込められた感情を出力することができ、・・・第MのパーソナライズドAIから出力された文章を感情分類器に入力すると、第MのパーソナライズドAIから出力された文章に込められた感情を出力することができる。このようにして、M個のパーソナライズドAIの出力からM個の感情を認識することができる。
【0112】
ステップS704では、プロセッサ部120’の感情認識手段124が、ステップS703で認識された感情に基づく出力を生成する。出力は、例えば、認識された感情が何であるかを示す出力であってもよいし、パーソナライズドAIからの回答が何であるかを示す出力であってもよい。出力は、例えば、認識された複数の感情のうちの各感情の割合を示す出力であってもよい。
【0113】
例えば、感情認識手段124は、1つのパーソナライズドAIからN個の感情が認識された場合に、1つの出力を生成するようにしてもよいし、N個の出力を生成するようにしてもよいし、n個の出力を生成するようにしてもよい(N>n)。例えば、感情認識手段124は、認識されたN個の感情のうち第1の感情が最も多い場合に第1の出力(例えば、認識された感情が第1の感情であることを示す出力、または、パーソナライズドAIからの回答が第1の回答であることを示す出力)を生成し、認識されたN個の感情のうち第2の感情が最も多い場合に第2の出力(例えば、認識された感情が第2の感情であることを示す出力、または、パーソナライズドAIからの回答が第2の回答であることを示す出力)を生成することができる。例えば、感情認識手段124は、認識されたN個の感情のうち上位n個の感情についての出力(例えば、認識された感情が第1~第nの感情であることを示す出力、または、パーソナライズドAIからの回答が第1~第nの回答であることを示す出力)を生成することができる(N>n)。
【0114】
感情認識手段124は、M個のパーソナライズドAIのそれぞれに対して、認識された感情に基づく出力を生成することができる。すなわち、感情認識手段124は、M個のパーソナライズドAIの各々から認識された感情に基づく1つの出力(計M個の出力)を生成するようにしてもよいし、M個のパーソナライズドAIの各々から認識されたN個の感情に基づくN個の出力(計M×N個の出力)を生成するようにしてもよいし、M個のパーソナライズドAIの各々から認識されたN個の感情に基づくn個の出力(計M×n個の出力)を生成するようにしてもよい(N>n)。
【0115】
ステップS705では、プロセッサ部120’の集計手段123が、ステップS704で生成された感情に基づく出力を集計する。集計手段123は、例えば、感情認識手段124による出力が示す感情を集計するようにしてもよいし、感情認識手段124による出力が示す感情を質問に対する回答に対応付けて集計するようにしてもよい。集計手段123は、例えば、感情認識手段124による出力が示すパーソナライズドAIからの回答を集計することができる。
【0116】
例えば、集計手段123は、複数の感情のうちの第1の感情(例えば、ポジティブな感情)の数および第2の感情(例えば、ネガティブな感情)の数を計算するようにしてもよいし、複数の感情のうちの第1の感情(例えば、ポジティブな感情)の割合および第2の感情(例えば、ネガティブな感情)を計算するようにしてもよい。例えば、集計手段123は、複数の感情のうちの第1の感情(例えば、ポジティブな感情)を第1の回答(例えば、Yesの回答)に対応付け、第2の感情(例えば、ネガティブな感情)を第2の回答(例えば、Noの回答)に対応付けて、それらの数または割合を計算するようにしてもよい。集計手段123は、例えば、優しい/厳しい、喜び/怒り/悲しみ、喜/怒/哀/楽等の感情であっても、質問に対する種々の回答に対応付けて集計することができる。
【0117】
集計された結果は、インターフェース部110を介してシステム100の外部に出力される。例えば、集計された結果は、質問者に提示される。
【0118】
図2Aに示された「次期大統領選で、○○氏を支持しますか?」という質問が入力された場合を例に、ステップS701~ステップS705の処理の一例を説明する。例示の簡単のために、3つのパーソナライズドAIを利用する例を説明する。
【0119】
ステップS701では、受信手段121が、「次期大統領選で、○○氏を支持しますか?」という質問を受信する。
【0120】
ステップS702では、回答生成手段122が、3つのパーソナライズドAIを用いて、「次期大統領選で、○○氏を支持しますか?」に対する回答を文章の形式で出力する。3つのパーソナライズドAIの各々は、プロンプトを入力すると、その続きの文章を生成することができる。ここで、「次期大統領選で、○○氏を支持しますか?」という質問の場合、質問に関連するプロンプトは、「私の考えでは○○氏は、」、「私は○○氏が好きか嫌いかで言うと、」、「私は○○氏に反対か賛成かと言うと、」、「個人的には○○氏のことを、」等であり得るが、これらに限定されない。
【0121】
例えば、第1の個人の表現を学習したパーソナライズドAIに質問に関連するプロンプト(例えば、「私の考えでは○○氏は、」)を入力すると、第1の個人の表現に従って、プロンプトの続きの文章(例えば、「勝つと思うなあ」)を生成することができ、第2の個人の表現を学習したパーソナライズドAIに質問に関連するプロンプト(例えば、「私の考えでは○○氏は、」)を入力すると、第2の個人の表現に従って、プロンプトの続きの文章(例えば、「うまくいく^^」)を生成することができ、第3の個人の表現を学習したパーソナライズドAIに質問に関連するプロンプト(例えば、「私の考えでは○○氏は、」)を入力すると、第3の個人の表現に従って、プロンプトの続きの文章(例えば、「よくはないと思料いたします」)を生成することができる。それぞれのパーソナライズドAIには、複数のプロンプトを入力し、複数の回答を得るようにしてもよい。
【0122】
ステップS703では、感情認識手段124が、3つのパーソナライズドAIの各々から出力された回答(例えば、「勝つと思うなあ」、「うまくいく^^」、「よくはないと思料いたします」)に込められた感情を認識する。感情認識手段124は、例えば、「勝つと思うなあ」および「うまくいく^^」、に込められた感情がポジティブな感情であると認識し、「よくはないと思料いたします」に込められた感情がネガティブな感情であると認識することができる。
【0123】
ステップS704では、感情認識手段124が、認識された感情に基づく出力を生成する。感情認識手段124は、例えば、第1のパーソナライズドAIからの回答に込められた感情がポジティブであり、第2のパーソナライズドAIからの回答に込められた感情がポジティブであり、第3のパーソナライズドAIからの回答に込められた感情がネガティブであることを示す出力を生成することができる。
【0124】
ステップS705では、集計手段123が、出力を集計する。集計手段123は、例えば、(ポジティブ:66.7%、ネガティブ:33.3%)として集計することができる。あるいは、ポジティブな感情=Yesの回答、ネガティブな感情=Noの回答と対応付けて、(Yes:66.7%、No:33.3%)として集計することができる。
【0125】
このようにして、「次期大統領選で、○○氏を支持しますか?」という質問に対して、3つのパーソナライズドAIによるアンケート調査によって、(ポジティブ:66.7%、ネガティブ:33.3%)または(Yes:66.7%、No:33.3%)という結果が示されることになる。
【0126】
図9は、実在する個人の情報を利用して、パーソナライズドAIを作成するためのフロー900の一例の概念図を示す。フロー900では、複数の実在する個人の情報を利用して、複数のパーソナライズドAIが作成される。
図9に示される例では、個人
1の情報から第1のパーソナライズドAI PAI
1が作成され、個人
2の情報から第2のパーソナライズドAI PAI
2が作成されている。このように、1人の個人の情報から1つのパーソナライズドAIが作成される。
【0127】
まず、パーソナライズドAIを作成するために利用される複数のモデルが準備される。複数のモデルは、例えば、文章を生成することが可能なモデルであり得る。文章生成モデルは、例えば、プロンプト(文章の書き出し)を入力すると、その続きの文章を生成することが可能なモデルであり得る。
【0128】
次いで、複数の個人のそれぞれの情報が準備される。複数の個人のそれぞれの情報は、例えば、それぞれの個人によって作成された文章(例えば、メール、チャット、SNSへの投稿)、それぞれの個人の行動を撮影した映像、それぞれの個人が発話した音声等を含む。個人の情報は、例えば、個人のライフログに含まれる。
【0129】
複数のモデルと、複数の個人の情報とが準備されると、ステップS91において、複数のモデルのそれぞれが、個人の情報を学習する。これにより、個人の情報を学習した複数の学習済モデル、すなわち、パーソナライズドAIが作成される。例えば、複数のモデルのうちの第1のモデルが個人1の情報を学習することにより、第1のパーソナライズドAI PAI1が作成され、複数のモデルのうちの第2のモデルが個人2の情報を学習することにより、第2のパーソナライズドAI PAI2が作成される。第1のパーソナライズドAI PAI1は、個人1らしい活動をすることができ、例えば、あたかも個人1がアンケートに回答したかのような回答を生成することができる。第2のパーソナライズドAI PAI1は、個人2らしい活動をすることができ、例えば、あたかも個人2がアンケートに回答したかのような回答を生成することができる。
【0130】
フロー900は、例えば、
図8に示される処理800によって実施され得る。
【0131】
図8は、アンケート調査のためのシステム100による処理の別の一例(処理800)を示すフローチャートである。処理800は、パーソナライズドAIを作成するための処理であり、システム100のプロセッサ部120または120’において行われ得る。以下では、システム100のプロセッサ部120において行われることを例に説明する。
【0132】
ステップS801では、プロセッサ部120は、文章を生成することが可能なモデルを準備する。プロセッサ部120は、例えば、データベース部200に格納されている文章生成モデルをデータベース部200から取得することができる。文章生成モデルは、例えば、プロンプト(文章の書き出し)を入力すると、その続きの文章を生成することが可能なモデルであり得る。
【0133】
ステップS802では、プロセッサ部120は、文章を生成することが可能なモデルに個人の表現を学習させる。これは、
図9におけるステップS91に対応している。このとき、個人の表現の偏りを是正することなく、個人の表現を学習させる。例えば、文章を生成することが可能なモデルを個人の表現でファインチューニングすることができる。既存のモデルをファインチューニングすることによって、モデルを一から作成する場合よりも、必要な学習データ量を少なくすることができ、時間コスト、メモリコストを小さくすることができる。
【0134】
通常、学習素材を学習させる際には、機械学習の偏りを防ぐために、偏りの無い学習素材を作成する必要がある。これに対して、ステップS802では、上述したように、通常の機械学習とは異なり、個人の表現の偏りを是正することなく、個人の表現を学習させる。これにより、作成されたパーソナライズドAIは、偏りのある結果を出力することになる。この「偏り」こそが「個性」であるとみなすことができ、パーソナライズドAIは、個性を含んだ文章を出力することができるようになる
【0135】
図10は、実在しない仮想的な個人の情報を利用して、パーソナライズドAIを作成するためのフロー1000の一例の概念図を示す。フロー1000では、複数の実在しない仮想個人の情報を利用して、1人の個人のパーソナライズドAIが作成される。
図10に示される例では、個人
1が質問に回答した結果と、仮想個人の情報とに基づいて、個人
1のパーソナライズドAIが作成される。
【0136】
まず、ステップS101において、個人1に対して質問が提示される。質問は、任意の質問であり得る。
【0137】
次に、ステップS102において、個人1が質問に対して回答する。個人1は、任意の態様で質問に対して回答することができる。例えば、個人1は、紙のアンケート用紙を介して質問に回答するようにしてもよいし、情報端末を介して質問に回答するようにしてもよいし、口頭で質問に回答するようにしてもよい。
【0138】
他方で、パーソナライズドAIを作成するために利用される複数のモデルが準備される。複数のモデルは、例えば、文章を生成することが可能なモデルであり得る。文章生成モデルは、例えば、プロンプト(文章の書き出し)を入力すると、その続きの文章を生成することが可能なモデルであり得る。
【0139】
次いで、複数の仮想個人のそれぞれの情報が準備される。複数の仮想個人のそれぞれの情報は、例えば、仮想的に作成された文章、仮想的に作成された映像、仮想的に作成された音声等を含み得る。文章、映像、音声等は、例えば、無作為に作成され得る。仮想個人の情報は、人間が理解可能な情報である必要はない。仮想個人の情報は、例えば、意味を持たない文字または記号の羅列であってもよい。例えば、仮想個人の情報は、既に作成されたパーソナライズドAIから出力される情報であってもよい。仮想個人の情報は、例えば、仮想的に作成された仮想的なライフログ(フェイクログ)に含まれ得る。フェイクログは、例えば、既に作成されたパーソナライズドAIから出力されるライフログであり得る。
【0140】
仮想個人の情報は、任意の手法で作成することができる。上述したように、仮想個人の情報は、人間が理解可能な情報である必要はないため、どのような手法で作成された情報であっても、仮想個人の情報として機能するからである。
【0141】
例えば、仮想個人の情報は、ランダム関数を利用して作成されることができる。一例において、仮想個人の情報は、文字(例えば、50音の文字、アルファベット等)および/または記号の表からランダムに文字または記号を選択し、選択された文字または記号を羅列することによって作成されることができる。
【0142】
例えば、仮想個人の情報は、実在する個人のライフログから作成されることができる。一例において、複数の実在する個人のライフログをシャッフルすることにより、作成されることができる。例えば、複数の実在する個人のライフログのうちの1つのライフログの一部(例えば、少なくとも1文字、少なくとも1語、少なくとも1句、少なくとも1節、少なくとも一文、少なくとも一段落等)を他の1または複数のライフログの一部で置換することによって、仮想個人の情報を作成することができる。例えば、複数の実在する個人のライフログを記憶したプールの中からランダムに文字、語、句、節、文、段落等を選択することによって、仮想個人の情報を作成することができる。複数の実在する個人のライフログに限らず、他の任意の情報(例えば、文章、映像、音声等)が、仮想個人の情報を作成するために利用され得る。
【0143】
例えば、仮想個人の情報は、既に作成されたパーソナライズドAIを用いて作成されることができる。既に作成されたパーソナライズドAIにプロンプト(文章の書き出し)を与えたときに出力された文章を仮想個人の情報とすることができる。
【0144】
複数のモデルと、複数の仮想個人の情報とが準備されると、ステップS103において、複数のモデルのそれぞれが、仮想個人の情報を学習する。これにより、仮想個人の情報を学習した複数の学習済モデル、すなわち、パーソナライズドAIが作成される。例えば、複数のモデルのうちの第1のモデルが仮想個人1の情報を学習することにより、第1のパーソナライズドAI PAI1が作成され、複数のモデルのうちの第2のモデルが仮想個人2の情報を学習することにより、第2のパーソナライズドAI PAI2が作成される。第1のパーソナライズドAI PAI1は、仮想個人1らしい活動をすることができ、例えば、あたかも仮想個人1がアンケートに回答したかのような回答を生成することができる。第2のパーソナライズドAI PAI1は、仮想個人2らしい活動をすることができ、例えば、あたかも仮想個人2がアンケートに回答したかのような回答を生成することができる。
【0145】
複数のパーソナライズドAIが作成されると、ステップS104で、複数のパーソナライズドAIのそれぞれに、ステップS101で個人1に提示された質問と同じ質問が提示される。
【0146】
ステップS105では、複数のパーソナライズドAIのそれぞれが、質問に対する回答を出力する。複数のパーソナライズドAIのそれぞれは、あたかも仮想個人が質問に回答したかのような回答を出力する。
【0147】
次いで、複数のパーソナライズドAIのそれぞれからの回答のうち、個人1による回答に最も近い回答が特定され、その回答を出力したパーソナライズドAIが、個人1のパーソナライズドAIであると決定される。これは、同じ質問に対して同様に回答したパーソナライズドAIであれば、個人1の思想と同様の思想に基づいた出力を生成することができるであろうという推測に基づいている。個人1およびパーソナライズドAIの双方に回答させる質問が複数または複雑であるほど、個人1のパーソナライズドAIであると決定されるパーソナライズドAIは、個人1の思想をより反映したものになり得る。
【0148】
実在しない仮想的な個人の情報を利用して、パーソナライズドAIを作成することにより、実在する個人の情報が利用不可能な場合であっても、パーソナライズドAIを作成することができる。例えば、個人のライフログを有しない企業であっても、個人に対して行ったアンケートの結果があれば、パーソナライズドAIを作成することができるのである。
【0149】
このようにして作成されたパーソナライズドAIは、例えば、疑似的な市場調査に利用することができる。例えば、顧客に実際にアンケートを取ることなく、複数のパーソナライズドAIにアンケートに回答させることにより、簡易かつ低コストで、市場の動向を調査することができる。
【0150】
フロー1000は、例えば、
図11に示される処理1100によって実装され得る。
【0151】
図11は、アンケート調査のためのシステム100による処理の別の一例(処理1100)を示すフローチャートである。処理1100は、パーソナライズドAIを作成するための別の処理であり、システム100のプロセッサ部120または120’において行われ得る。以下では、システム100のプロセッサ部120において行われることを例に説明する。
【0152】
ステップS1101では、プロセッサ部120は、個人が質問に対して回答した結果を取得する。これは、
図10におけるステップS102に対応し得る。個人は、実在する人物である。質問は、任意の質問であり得る。質問は、例えば、多肢選択回答式の質問であってもよいし、記述回答式または論述回答式の質問であってもよい。質問は、任意の数であり得る。質問の数が多いほど好ましい。質問の数が多いほど、処理1100により生成されるパーソナライズドAIの精度が高くなる傾向があるからである。
【0153】
プロセッサ部120が、個人が質問に対して回答した結果をどこから取得するかは問わない。例えば、個人が質問に対して回答した結果がデータベース部200に格納されている場合には、プロセッサ部120は、データベース部から個人が質問に対して回答した結果を取得することができる。あるいは、例えば、プロセッサ部120は、個人の端末装置300から個人が質問に対して回答した結果を取得することができる。あるいは、例えば、プロセッサ部120は、ネットワーク400に接続された他の場所から個人が質問に対して回答した結果を取得することができる。
【0154】
ステップS1102では、プロセッサ部120は、文章を生成することが可能な複数のモデルを準備する。プロセッサ部120は、例えば、データベース部200に格納されている文章生成モデルをデータベース部200から取得することができる。文章生成モデルは、例えば、プロンプト(文章の書き出し)を入力すると、その続きの文章を生成することが可能なモデルであり得る。
【0155】
ステップS1103では、プロセッサ部120は、文章を生成することが可能な複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成する。これは、
図10におけるステップS103に対応している。このとき、1つのモデルに対して、1人の個人の表現を学習させる。すなわち、複数のモデルのうちの1つに複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成される。例えば、ステップS1102でn個のモデルが準備された場合、第1のモデルに第1の個人の表現を学習させることにより、1個目の学習済モデルが生成され、第2のモデルに第2の個人の表現を学習させることにより、2個目の学習済モデルが生成され、・・・第nのモデルに第nの個人の表現を学習させることにより、n個目の学習済モデルが生成される。これにより、n個の学習済モデルが生成される。
【0156】
個人の表現は、実在する人物による表現であってもよいし、実在しない仮想的な人物による表現であってもよい。好ましくは、個人の表現は、少なくとも1人の仮想的な個人の表現を含む。これにより、作成された学習済モデルは、仮想的な個人の表現で文章を作成することが可能なモデルとなる。ここで、仮想的な個人の表現は、必ずしも人間が理解可能な情報である必要はなく、仮想的な個人の情報は、例えば、意味を持たない文字または記号の羅列であってもよい。
【0157】
複数の個人の表現は、例えば、複数のライフログから抽出され得る。すなわち、複数の個人の表現は、例えば、複数のライフログを取得することと、取得された複数のライフログから複数の個人の表現を抽出することとによって準備されることができる。このとき、好ましくは、複数のライフログは、少なくとも1つの仮想的なライフログを含み得る。仮想的なライフログは、例えば、作成済のパーソナライズドAIから出力された情報を記録したものであり得る。
【0158】
個人の表現を学習させるとき、個人の表現の偏りを是正することなく、個人の表現を学習させることが好ましい。通常、学習素材を学習させる際には、機械学習の偏りを防ぐために、偏りの無い学習素材を作成する必要がある。これに対して、ステップS1003では、上述したように、通常の機械学習とは異なり、個人の表現の偏りを是正することなく、個人の表現を学習させる。これにより、作成された学習済モデルは、偏りのある結果を出力することになる。この「偏り」こそが「個性」であるとみなすことができ、学習済モデルは、個性を含んだ文章を出力することができるようになる。例えば、学習済モデルにプロンプト(文章の書き出し)を与えると、学習済モデルは、学習した個人の表現に従って、その続きの文章を生成することができる
【0159】
個人の表現を学習させるとき、例えば、文章を生成することが可能なモデルを個人の表現でファインチューニングするようにしてもよい。既存のモデルをファインチューニングすることによって、モデルを一から作成する場合よりも、必要な学習データ量を少なくすることができ、時間コスト、メモリコストを小さくすることができる。
【0160】
ステップS1104では、プロセッサ部120は、ステップS1103で生成された複数の学習済モデルのそれぞれから、質問に対する回答を出力する。これは、
図10におけるステップS104およびステップS105に対応している。質問は、ステップS1101で個人が回答した結果が取得された質問と同一の質問である。例えば、複数の学習済モデルは、プロンプト(文章の書き出し)を与えると、学習した個人の表現に従って、その続きの文章を生成することができるため、質問に関連するプロンプトを複数の学習済モデルのそれぞれに入力することにより、複数の学習済モデルのそれぞれから質問の回答を得ることができる。質問に関連するプロンプトは、例えば、質問の種類に応じて予め設定されたテンプレートから選択されるようにしてもよいし、質問に基づいて作成されるようにしてもよいし、質問毎に設定されるようにしてもよいし、パーソナライズドAIの作成者によって設定されるようにしてもよい。質問に関連するプロンプトが質問に基づいて作成される場合には、例えば、予め設定されたテンプレートに基づいてプロンプトを作成するようにしてもよいし、機械学習を利用してプロンプトを生成するようにしてもよい。
【0161】
学習済モデルは、学習した個人の表現に従って、これらのプロンプトの続きの文章を生成することができる。生成された文章が、質問に対する回答となる。あるいは、上述した感情認識手段124により、生成された文章に込められた感情を認識し、認識された感情を質問に対する回答としてもよい。あるいは、上述した感情認識手段124により、生成された文章に込められた感情を認識し、認識された感情に基づく出力を生成し、上述した集計手段123により、生成された出力を集計した結果を質問に対する回答としてもよい。
【0162】
例えば、n個の学習済モデルが生成された場合、1個目の学習済モデルから質問に対する第1の回答を出力し、2個目の学習済モデルから質問に対する第2の回答を出力し、・・・n個目の学習済モデルから質問に対する第nの回答を出力する。これにより、n個の回答が生成される。
【0163】
ステップS1105では、プロセッサ部120は、ステップS1104で複数の学習済モデルから出力された複数の回答と、ステップS1101で取得された結果とに基づいて、1つの学習済モデルを決定する。プロセッサ部120は、例えば、ステップS1101で取得された結果と同一の回答を出力した1つの学習済モデルを決定することができる。あるいは、プロセッサ部120は、例えば、ステップS1104で複数の学習済モデルから出力された複数の回答と、ステップS1101で取得された結果との類似度に基づいて、1つの学習済モデルを決定することができる。プロセッサ部120は、例えば、ステップS1101で取得された結果に最も近い回答を出力した1つの学習済モデルを決定することができる。ここで、類似度として任意の公知の指標を利用することができる。
【0164】
例えば、ステップS1101で取得された結果が多肢選択回答式の質問に対する回答であった場合には、ステップS1104で複数の学習済モデルから出力された複数の回答と、ステップS1101で取得された結果とを定量的に比較することができる。例えば、ステップS1101で取得された結果が記述回答式または論述回答式の質問に対する回答であった場合には、ステップS1101で取得された結果を定量データに変換することにより、ステップS1104で複数の学習済モデルから出力された複数の回答と、ステップS1101で取得された結果とを定量的に比較することができるようになる。例えば、記述回答式または論述回答式の質問に対する回答の定量化は、回答の内容を分析することによって行われる。これは、例えば、人間によって行われてもよいし、AIによって行われてもよい。あるいは、これは、例えば、感情認識手段124により、込められた感情を認識を分析することによって行われてもよい。
【0165】
決定された1つの学習済モデルは、個人が質問に対して回答した結果と同一または類似する回答を出力することができるため、個人のパーソナライズドAIであるとみなすことができる。これは、同じ質問に対して個人と同様に回答したパーソナライズドAIであれば、個人の思想と同様の思想に基づいた出力を生成することができるであろうという推測に基づいている。決定された1つの学習済モデルから別の質問に対する回答を出力させると、その回答は、あたかも個人が回答したかのような回答であると期待される。
【0166】
処理1100によれば、学習に用いる個人の表現が、少なくとも1人の仮想的な個人の表現を含んでいたとしても、パーソナライズドAIを作成することができる。例えば、十分な数の個人の情報を有していない場合、または、個人の情報を全く有していない場合でさえも、個人が回答した結果があれば、パーソナライズドAIを作成することができるのである。これは、パーソナライズドAIの作成の可能性を広げ、ひいては、デジタルクローンアンケート調査の可能性も広げ得る。
【0167】
図12Aは、処理1100におけるステップS1105の具体的なステップの一例を示す。この例は、処理1100の過程で作成された複数の学習済モデルのうちの少なくとも1つに、仮想的な個人の表現を出力させ、出力された仮想的な個人の表現を用いて学習済モデルを作成する処理を含む。
【0168】
例えば、
図12Aに示される処理は、個人のパーソナライズドAIであるとみなすことができる学習済モデルが存在しない場合、例えば、ステップS1104で複数の学習済モデルから出力された複数の回答と、ステップS1101で取得された結果との類似度のいずれも所定の閾値を超えない場合に、行われることができる。
【0169】
ステップS1201では、プロセッサ部120は、ステップS1103で作成された複数の学習済モデルのうちの少なくとも1つから少なくとも1つの仮想的な個人の表現を出力する。複数の学習済モデルのうちの少なくとも1つは、例えば、ステップS1104で複数の学習済モデルから出力された複数の回答と、ステップS1101で取得された結果との類似度に基づいて、決定されることができる。例えば、複数の学習済モデルのうちの少なくとも1つは、類似度が最も高い少なくとも1つの学習済モデルであり得る。例えば、複数の学習済モデルのうちの少なくとも1つは、類似度が所定値よりも大きい少なくとも1つの学習済モデルであり得る。実在する個人の回答により近い回答を出力可能な学習済モデルを用いることにより、出力される仮想的な個人の表現が、実在する個人に近いものとなり得るからである。これは、最終的に作成される実在する個人のパーソナライズドAIの精度を向上させることにつながり得る。ステップS1103で作成された複数の学習済モデルのうちの少なくとも1つは、プロンプトを与えられるとその続きの文章を出力することができるため、例えば、これを利用して、仮想的な個人の表現を出力することができる。
【0170】
ステップS1202では、文章を生成することが可能な複数のモデルに、ステップS1201で出力された少なくとも1つの仮想的な個人の表現を学習させることにより、少なくとも1つの第2の学習済モデルを生成する。ステップS1202は、ステップS1103と同様の処理である。ステップS1202では、1つのモデルに対して、1人の仮想的な個人の表現を学習させる。すなわち、複数のモデルのうちの1つに少なくとも1つの仮想的な個人の表現のうちの1つを学習させることにより、1つの第2の学習済モデルが生成される。例えば、ステップS1201でn個の仮想的な個人の表現が出力された場合、第1のモデルに第1の仮想的な個人の表現を学習させることにより、1個目の第2の学習済モデルが生成され、第2のモデルに第2の仮想的な個人の表現を学習させることにより、2個目の第2の学習済モデルが生成され、・・・第nのモデルに第nの仮想的な個人の表現を学習させることにより、n個目の第2の学習済モデルが生成される。これにより、n個の第2の学習済モデルが生成される。
【0171】
仮想的な個人の表現を学習させるとき、仮想的な個人の表現の偏りを是正することなく、仮想的な個人の表現を学習させることが好ましい。通常、学習素材を学習させる際には、機械学習の偏りを防ぐために、偏りの無い学習素材を作成する必要がある。これに対して、ステップS1202では、上述したように、通常の機械学習とは異なり、仮想的な個人の表現の偏りを是正することなく、仮想的な個人の表現を学習させる。これにより、作成された第2の学習済モデルは、偏りのある結果を出力することになる。この「偏り」こそが「個性」であるとみなすことができ、第2の学習済モデルは、仮想的な個人の個性を含んだ文章を出力することができるようになる。例えば、第2の学習済モデルにプロンプト(文章の書き出し)を与えると、第2の学習済モデルは、学習した仮想的な個人の表現に従って、その続きの文章を生成することができる。
【0172】
仮想的な個人の表現を学習させるとき、例えば、文章を生成することが可能なモデルを個人の表現でファインチューニングするようにしてもよい。既存のモデルをファインチューニングすることによって、モデルを一から作成する場合よりも、必要な学習データ量を少なくすることができ、時間コスト、メモリコストを小さくすることができる。
【0173】
ステップS1203では、プロセッサ部120は、ステップS1202で生成された少なくとも1つの第2の学習済モデルから、質問に対する回答を出力する。ステップS1203は、ステップS1104と同様の処理である。質問は、ステップS1101で個人が回答した結果が取得された質問と同一の質問である。例えば、第2の学習済モデルは、プロンプト(文章の書き出し)を与えると、学習した仮想的な個人の表現に従って、その続きの文章を生成することができるため、質問に関連するプロンプトを第2の学習済モデルに入力することにより、第2の学習済モデルから質問の回答を得ることができる。質問に関連するプロンプトは、例えば、質問の種類に応じて予め設定されたテンプレートから選択されるようにしてもよいし、質問に基づいて作成されるようにしてもよいし、質問毎に設定されるようにしてもよいし、パーソナライズドAIの作成者によって設定されるようにしてもよい。質問に関連するプロンプトが質問に基づいて作成される場合には、例えば、予め設定されたテンプレートに基づいてプロンプトを作成するようにしてもよいし、機械学習を利用してプロンプトを生成するようにしてもよい。
【0174】
第2の学習済モデルは、学習した仮想的な個人の表現に従って、これらのプロンプトの続きの文章を生成することができる。生成された文章が、質問に対する回答となる。あるいは、上述した感情認識手段124により、生成された文章に込められた感情を認識し、認識された感情を質問に対する回答としてもよい。あるいは、上述した感情認識手段124により、生成された文章に込められた感情を認識し、認識された感情に基づく出力を生成し、上述した集計手段123により、生成された出力を集計した結果を質問に対する回答としてもよい。
【0175】
例えば、n個の第2の学習済モデルが生成された場合、1個目の第2の学習済モデルから質問に対する第1の回答を出力し、2個目の第2の学習済モデルから質問に対する第2の回答を出力し、・・・n個目の第2の学習済モデルから質問に対する第nの回答を出力する。これにより、n個の回答が生成される。
【0176】
ステップS1204では、プロセッサ部120は、ステップS1104で複数の学習済モデルから出力された複数の回答と、ステップS1203で少なくとも1つの第2の学習済モデルから出力された少なくとも1つの回答と、ステップS1101で取得された結果とに基づいて、1つの学習済モデルを決定する。プロセッサ部120は、例えば、複数の学習済モデルおよび少なくとも1つの第2の学習済モデルの中から、ステップS1101で取得された結果と同一の回答を出力した1つの学習済モデルを決定することができる。あるいは、プロセッサ部120は、例えば、ステップS1104で複数の学習済モデルから出力された複数の回答およびステップS1203で少なくとも1つの第2の学習済モデルから出力された少なくとも1つの回答と、ステップS1101で取得された結果との類似度に基づいて、複数の学習済モデルおよび少なくとも1つの第2の学習済モデルの中から、1つの学習済モデルを決定することができる。プロセッサ部120は、例えば、ステップS1101で取得された結果に最も近い回答を出力した1つの学習済モデルを決定することができる。ここで、類似度として任意の公知の指標を利用することができる。
【0177】
例えば、プロセッサ部120は、例えば、複数の学習済モデルおよび少なくとも1つの第2の学習済モデルの中から、少なくとも2つの学習済モデルを抽出し、抽出された2つの学習済モデルに基づいて、1つの学習済モデルを生成するようにしてもよい。例えば、抽出された2つの学習済モデルを平均することにより、1つの学習済モデルを生成することができる。
【0178】
決定された1つの学習済モデルは、個人が質問に対して回答した結果と同一または類似する回答を出力することができるため、個人のパーソナライズドAIであるとみなすことができる。
【0179】
図12Bは、処理1100におけるステップS1105の具体的なステップの別の一例を示す。この例は、処理1100の過程で作成された複数の学習済モデルのうちの少なくとも1つに、仮想的な個人の表現を出力させ、出力された仮想的な個人の表現を用いて学習済モデルを作成する処理を含み、実在する個人が回答した結果に類似する回答を出力することが可能な学習済モデルが生成されるまで、当該処理を繰り返すことを特徴としている。
【0180】
ステップS1201~ステップS1203は、
図12Aを参照して上述したステップと同様であり、ここでは説明を省略する。
【0181】
ステップS1205では、プロセッサ部120は、所定の条件を満たすか否かを判定する。
【0182】
所定の条件は、例えば、ステップS1104で複数の学習済モデルから出力された複数の回答およびステップS1203で少なくとも1つの第2の学習済モデルから出力された回答のうちのいずれか1つと、ステップS1101で取得された結果との類似度が所定の閾値を超えることであり得る。上述したように、類似度として任意の公知の指標を利用することができる。また、所定の閾値として任意の閾値を設定することができる。所定の閾値を高くするほど、処理1100によって生成されるパーソナライズドAIの精度が高くなり得る。あるいは、所定の条件は、例えば、ステップS1201~ステップS1203を繰り返した回数が所定の閾値を超えることであり得る。繰り返しの回数を制限することにより、処理が発散することを回避することができる。あるいは、所定の条件は、例えば、処理の経過時間が所定の閾値を超えることであり得る。処理の時間を制限することにより、処理が発散することを回避することができる。
【0183】
ステップS1205で所定の条件を満たすと判定される場合、ステップS1204’に進む。ステップS1205で所定の条件を満たさないと判定される場合、ステップS1201~ステップS1203が繰り返される。
【0184】
ステップS1201~ステップS1203が繰り返される場合、ステップS1201では、複数の学習モデルのうちの少なくとも1つから少なくとも1つの仮想的な個人の表現を出力することに加えて、ステップS1202で生成された少なくとも1つの第2の学習済モデルから少なくとも1つの仮想的な個人の表現を出力することができる。これにより、ステップS1202では、複数の学習モデルのうちの少なくとも1つから出力された仮想的な個人の表現に加えて、少なくとも1つの第2の学習済モデルから出力された仮想的な個人の表現も学習に用いられることになる。
【0185】
ステップS1204’では、プロセッサ部120は、複数の学習済モデルおよび少なくとも1つの第2の学習済モデルの中から、所定の条件を満たす学習済モデルを特定する。
【0186】
所定の条件は、例えば、類似度が所定の閾値を超えることであり得る。あるいは、所定の条件は、繰り返しの回数または処理の経過時間が閾値を超えたときに、類似度が最も高いことであり得る。
【0187】
特定された学習済モデルが、個人のパーソナライズドAIであるとみなされ得る。このようにして作成されたパーソナライズドAIは、より精度よく、個人の思想と同様の思想に基づいた出力を生成することができることが期待される。
【0188】
図5~
図12を参照して上述した例では、特定の順序で処理が行われることを説明したが、各処理の順序は説明されたものに限定されず、論理的に可能な任意の順序で行われ得る。
【0189】
図5~
図8、
図11~
図12Bを参照して上述した例では、
図5~
図8、
図11~
図12Bに示される各ステップの処理は、プロセッサ部120または120’とメモリ部130に格納されたプログラムとによって実現することが説明されたが、本発明はこれに限定されない。
図5~
図8、
図11~
図12Bに示される各ステップの処理のうちの少なくとも1つは、制御回路などのハードウェア構成によって実現されてもよい。
【0190】
具体例を用いて、個人のパーソナライズドAIであるとみなすことができるパーソナライズドAIを作成することを説明する。本例では、ランダムに作成したフェイクログを用いて、複数のパーソナライズドAIを作成し、作成された複数のパーソナライズドAIのそれぞれに質問に回答させることによって、個人の回答と同一の回答を出力可能なパーソナライズドAIを識別する。
【0191】
100組のフェイクログを利用して100個のパーソナライズドAIを作成する。1つの文章生成モデルに1組のフェイクログを学習させる。100組のフェイクログはランダム関数を用いてランダムな文字および記号列として作成される。
【0192】
個人に与えられる質問は、○または×の2選択で回答する問いを合計2問備える質問である。回答は、○○、○×、×○、××の4通りのうちのいずれかとなる。或る個人に、この質問に回答させる。
【0193】
他方で、100個のパーソナライズドAIのそれぞれに、同一の質問(○または×の2選択で回答する問いを合計2問そなえる)に回答させる。
【0194】
或る個人による回答が○×であったとき、100個のパーソナライズドAIのうち、○×と回答したパーソナライズドAIが、個人の回答と同一の回答を出力可能なパーソナライズドAIとして識別される。
【0195】
この例では、4分の1の確率で個人の回答と同一の回答を出力可能なパーソナライズドAIが識別されると見込まれる。
【0196】
このように、質問の回答の「場合の数」に対して十分に大きい数のパーソナライズドAIを作成することにより、個人の回答と同一の回答を出力可能なパーソナライズドAIが識別される可能性は十分に高くなると考えられる。作成すべきパーソナライズドAIの数が発散しないようにするため、または、計算量が膨大にならないようにするために、回答の「場合の数」を制限することが好ましくあり得る。
【0197】
上述した例では、システム100が、デジタルクローンアンケート調査のためサービスを提供するサービスプロバイダに設置されているコンピュータ(例えば、サーバ装置)である場合を例に説明したが、本発明は、これに限定されない。システム100は、プロセッサ部を備える任意の情報処理装置であり得る。システム100は、例えば、ユーザの端末装置であってもよい。
【実施例0198】
(パーソナライズドAIの作成)
本実施例では、既存の文章生成モデルをベースにして、個人の表現に従った文章を日本語で生成することが可能なパーソナライズドAIを作成した。
【0199】
既存の文章生成モデルとして、OpenAIによって開発された汎用の文章生成モデルGPT-2modelを利用した。GPT-2modelは、2020年時点では日本語に非対応であったため、まずは、日本語の文章を生成することが可能な日本語版GPT-2modelを作成した。
【0200】
日本語版GPT-2modelを作成するための学習データを作成するために、日本語のWikipedia XML dump file(https://dumps.wikimedia.org/jamwiki/20200501)のデータを利用し、コーパスデータを生成した。コーパスデータから、Wikipediaの記事の90%を含むトレーニングデータ、Wikipediaの記事の5%を含むバリデーションデータ、Wikipediaの記事の5%を含むテストデータを生成した。
【0201】
GPT-2modelをトレーニングデータで訓練し、訓練されたモデルをバリデーションデータおよびテストデータで検証およびテストした。訓練は、Huggingface’s transformers libraryから利用可能なPytorch implementationを使用して1 GPU GeForce RTXTM 2080上で行った。モデルのサイズは、GPT-2 smallの1024よりも小さい768のembedding size、position embedding size、context sizeを用いたこと以外は、N=12層を有するGPT-2 smallに対応している。32のバッチサイズに対応する、gradient accumulation step 16のバッチサイズ2を使用した。1e-4の初期学習率を使用した。5エポックでモデルを訓練した。
【0202】
perplexityの尺度を用いて、訓練されたGPT-2modelをテストデータで評価した。perplexityは、19.31であった。
【0203】
次に、訓練された日本語版GPT-2modelを或る1人の個人の表現でファインチューニングした。まず、その個人の表現のテキストを収集した。その個人によるチャット履歴およびソーシャルメディアへの投稿からその個人の表現のテキストを収集した。収集されたテキストから、短すぎる文、含まれる単語が少なすぎる文、URL、句読点等を除去した。表1は、収集されたテキストの統計を示している。
【表1】
【0204】
収集されたテキストを用いて、日本語版GPT-2modelをファインチューニングした。ファインチューニングのために用いられるデータに過剰適合しないように、2e-5の学習率でファインチューニングした。
【0205】
表2は、ファインチューニングをしていない日本語版GPT-2modelによって生成された文章と、ファインチューニングした日本語版GPT-2modelによって生成された文章とを示す。「この報告書は」、「このプロジェクトは」、「自然言語処理は」という3つのプロンプトを与えたときのそれぞれの結果が示されている。
【表2-1】
【表2-2】
【表2-3】
【0206】
表2では、ファインチューニングをしていない日本語版GPT-2modelが、より堅苦しい表現で文章を生成している一方で、ファインチューニングした日本語版GPT-2modelが、個人の表現に従って、文章を生成していることが分かる。注目すべきは、ファインチューニングした日本語版GPT-2modelが、個人の表現として、^^等の絵文字を使用することまでも学習していることである。
【0207】
ファインチューニングした日本語版GPT-2modelにより、個人の表現で文章を生成することが可能なパーソナライズドAIを実現することができる。
【0208】
本発明は、上述した実施形態に限定されるものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。
前記複数のパーソナライズドAIの各々は、相互に異なる個人の表現を学習しており、前記複数のパーソナライズドAIの各々は、前記学習した個人の表現に従って、文章を生成することが可能であり、
前記複数のパーソナライズドAIの各々は、前記質問に対する回答として、前記学習した個人の表現に従った文章を出力する、
請求項1に記載のシステム。
前記所定の条件は、前記複数の学習済モデルから出力された複数の回答および前記少なくとも1つの第2の学習済モデルから出力された回答のうちのいずれか1つと、前記個人が回答した結果との類似度が所定の閾値を超えることを含む、請求項16に記載の方法。
質問に対して回答を出力可能なパーソナライズドAIを作成するためのプログラムであって、前記プログラムは、プロセッサ部を備えるコンピュータシステムにおいて実行され、前記プログラムは、
個人が質問に対して回答した結果を取得することと、
文章を生成することが可能な複数のモデルを準備することと、
前記複数のモデルに複数の個人の表現を学習させることにより、複数の学習済モデルを生成することであって、前記複数のモデルのうちの1つに前記複数の個人の表現のうちの1つを学習させることにより、1つの学習済モデルが生成され、前記複数の個人の表現は、少なくとも1人の仮想的な個人の表現を含む、ことと、
前記複数の学習済モデルのそれぞれから前記質問に対する回答を出力することと、
前記複数の学習済モデルから出力された複数の回答と、前記結果とに基づいて、1つの学習済モデルを決定することと
を含む処理を前記プロセッサ部に行わせる、プログラム。