(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-07-30
(45)【発行日】2024-08-07
(54)【発明の名称】情報処理装置、プログラム及び情報処理方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20240731BHJP
G06F 16/90 20190101ALI20240731BHJP
G06N 3/0475 20230101ALI20240731BHJP
G06N 3/09 20230101ALI20240731BHJP
【FI】
G06N20/00 130
G06F16/90 100
G06N3/0475
G06N3/09
(21)【出願番号】P 2024054860
(22)【出願日】2024-03-28
【審査請求日】2024-04-02
【早期審査対象出願】
(73)【特許権者】
【識別番号】521030168
【氏名又は名称】株式会社Citadel AI
(74)【代理人】
【識別番号】110001139
【氏名又は名称】SK弁理士法人
(74)【代理人】
【識別番号】100130328
【氏名又は名称】奥野 彰彦
(74)【代理人】
【識別番号】100130672
【氏名又は名称】伊藤 寛之
(72)【発明者】
【氏名】ソン ケニー イジョ
【審査官】千葉 久博
(56)【参考文献】
【文献】国際公開第2020/240981(WO,A1)
【文献】中国特許出願公開第117409109(CN,A)
【文献】Rebecca Li, 外2名,“LLMをゼロからトレーニングするためのベストプラクティス”,第7回 AI・人工知能 EXPO[春] ,2023年05月10日,p.1-23
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06F 16/90
G06N 3/0475
G06N 3/09
(57)【特許請求の範囲】
【請求項1】
生成AIを用いたコンテンツ生成システムを検証する情報処理装置であって、
前記コンテンツ生成システムは、プロンプトを入力する入力者からの入力者入力情報を受け付けてシステム入力情報として前記生成AIに送信し、当該システム入力情報に対する前記生成AIからのAI出力情報を取得して、当該AI出力情報に基づいてシステム出力情報を前記入力者に提供するものであり、
制御手段と、記憶手段とを備え、
前記制御手段は、出力情報取得部と、出力情報検証部と、フィードバック情報取得部と、履歴情報記録部と、報酬モデル学習部と、を備え、
前記出力情報取得部は、前
記AI出力情報を取得し、
前記出力情報検証部は、前記AI出力情報を検証し、
前記フィードバック情報取得部は、前
記システム出力情報に対する前記入力者からのフィードバック情報を取得し、
前記履歴情報記録部は、前記AI出力情報と前記フィードバック情報とを履歴情報として前記記憶手段に記録し、
前記報酬モデル学習部は、前記履歴情報に基づいて報酬モデルを学習させる、情報処理装置。
【請求項2】
請求項1に記載の情報処理装置であって、
前記制御手段は、入力情報取得部をさらに備え、
前記入力情報取得部は、前
記入力者入力情報及び前
記システム入力情報の少なくとも一方を取得し、
前記履歴情報記録部は、前記AI出力情報及び前記フィードバック情報に加えて、前記入力者入力情報及び前記システム入力情報の少なくとも一方を前記履歴情報として前記記憶手段に記録し、
前記報酬モデル学習部は、当該履歴情報に基づいて前記報酬モデルを学習させる、情報処理装置。
【請求項3】
請求項2に記載の情報処理装置であって、
前記入力情報取得部及び前記フィードバック情報取得部は、予め前記コンテンツ生成システムにAPIを提供しておき、当該APIを用いて、前記コンテンツ生成システムから、前記入力者入力情報及び前記システム入力情報の少なくとも一方と、前記フィードバック情報とをそれぞれ取得する、情報処理装置。
【請求項4】
請求項1に記載の情報処理装置であって、
前記出力情報取得部は、予め前記コンテンツ生成システムにAPIを提供しておき、当該APIを用いて前記コンテンツ生成システムから前記AI出力情報を取得する、情報処理装置。
【請求項5】
請求項1に記載の情報処理装置であって、
前記制御手段は、出力情報提示部をさらに備え、
前記出力情報提示部は、前記出力情報検証部の検証結果に基づいて、前記システム出力情報とともに、又は前記システム出力情報に代えて、前記検証結果を前記入力者に提示する、情報処理装置。
【請求項6】
請求項1に記載の情報処理装置であって、
前記報酬モデル学習部は、学習フェーズにおいて、前記AI出力情報と当該AI出力情報に対する評価とに基づいて前記報酬モデルを予め学習させ、
前記出力情報検証部は、提供フェーズにおいて、前記報酬モデルを用いて前記AI出力情報を検証し、
前記報酬モデル学習部は、前記提供フェーズにおいて、前記履歴情報に基づいて前記報酬モデルを更新する、情報処理装置。
【請求項7】
請求項6に記載の情報処理装置であって、
前記制御手段は、入力情報取得部をさらに備え、
前記入力情報取得部は、前記学習フェーズにおいて、前
記入力者入力情報及び前
記システム入力情報の少なくとも一方を取得し、
前記報酬モデル学習部は、前記学習フェーズにおいて、前記入力者が入力する学習用データセットについての前記入力者入力情報及び前記システム入力情報の少なくとも一方と、これに対する前記AI出力情報と、当該AI出力情報に対する評価とに基づいて前記報酬モデルを学習させる、情報処理装置。
【請求項8】
請求項6に記載の情報処理装置であって、
前記出力情報検証部は、前記提供フェーズにおいて、前記報酬モデルを用いた検証に加えて、前記AI出力情報の有害性、正確性及び感情の少なくとも1つをさらに検証する、情報処理装置。
【請求項9】
請求項2に記載の情報処理装置であって、
前記制御手段は、入力情報検証部をさらに備え、
前記入力情報検証部は、前記入力者入力情報の有害性及び感情の少なくとも1つを検証する、情報処理装置。
【請求項10】
請求項1に記載の情報処理装置であって、
前記報酬モデル学習部は、単一入力者ごと又は同じグループに所属する複数の入力者ごとに前記報酬モデルを学習させる、情報処理装置。
【請求項11】
請求項1~請求項10のいずれかに記載の情報処理装置であって、
前記生成AIは大規模言語モデルであり、前記コンテンツ生成システムは文章生成システムである、情報処理装置。
【請求項12】
生成AIを用いたコンテンツ生成システムを検証する情報処理方法であって、
前記コンテンツ生成システムは、プロンプトを入力する入力者からの入力者入力情報を受け付けてシステム入力情報として前記生成AIに送信し、当該システム入力情報に対する前記生成AIからのAI出力情報を取得して、当該AI出力情報に基づいてシステム出力情報を前記入力者に提供するものであり、
出力情報取得処理と、出力情報検証処理と、フィードバック情報取得処理と、履歴情報記録処理と、報酬モデル学習処理とを行い、
前記出力情報取得処理では、前
記AI出力情報を取得し、
前記出力情報検証処理では、前記AI出力情報を検証し、
前記フィードバック情報取得処理では、前
記システム出力情報に対する前記入力者からのフィードバック情報を取得し、
前記履歴情報記録処理では、前記AI出力情報と前記フィードバック情報とを履歴情報として記憶手段に記録し、
前記報酬モデル学習処理では、前記履歴情報に基づいて報酬モデルを学習させる、情報処理方法。
【請求項13】
生成AIを用いたコンテンツ生成システムを検証するプログラムであって、
前記コンテンツ生成システムは、プロンプトを入力する入力者からの入力者入力情報を受け付けてシステム入力情報として前記生成AIに送信し、当該システム入力情報に対する前記生成AIからのAI出力情報を取得して、当該AI出力情報に基づいてシステム出力情報を前記入力者に提供するものであり、
コンピュータに、出力情報取得処理と、出力情報検証処理と、フィードバック情報取得処理と、履歴情報記録処理と、報酬モデル学習処理とを実行させ、
前記出力情報取得処理では、前
記AI出力情報を取得し、
前記出力情報検証処理では、前記AI出力情報を検証し、
前記フィードバック情報取得処理では、前記システム出力情報に対する前記入力者からのフィードバック情報を取得し、
前記履歴情報記録処理では、前記AI出力情報と前記フィードバック情報とを履歴情報として記憶手段に記録し、
前記報酬モデル学習処理では、前記履歴情報に基づいて報酬モデルを学習させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、プログラム及び情報処理方法に関する。
【背景技術】
【0002】
近年、大規模言語モデル(LLM)を用いて文章生成を行うアプリケーションやサービスが開発されている。例えば、特許文献1には、LLMからの回答文の正確性を高めるため、LLMに入力するための質問文(プロンプト)を生成する装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、プロンプトを改善したとしても、依然としてLLMやLLMを用いた文章生成システムが不適当な回答文を生成するおそれがあり、文章生成システムを安全に提供あるいは使用することができなかった。また、このような望まない結果を出力する問題は、LLM及びこれに対応する文章生成システムに限らず、画像・動画生成AI等の他の生成AI及び対応するコンテンツ生成システムでも生じていた。
【0005】
本発明はこのような事情に鑑みてなされたものであり、生成AIを用いたコンテンツ生成システムの信頼性を向上させるための情報処理装置を提供するものである。
【課題を解決するための手段】
【0006】
本発明によれば、以下の発明が提供される。
[1]生成AIを用いたコンテンツ生成システムを検証する情報処理装置であって、制御手段と、記憶手段とを備え、前記制御手段は、出力情報取得部と、出力情報検証部と、フィードバック情報取得部と、履歴情報記録部と、報酬モデル学習部と、を備え、前記出力情報取得部は、前記コンテンツ生成システムへプロンプトを入力する入力者からの入力に対する前記生成AIからのAI出力情報を取得し、前記出力情報検証部は、前記AI出力情報を検証し、前記フィードバック情報取得部は、前記コンテンツ生成システムからのシステム出力情報に対する前記入力者からのフィードバック情報を取得し、前記履歴情報記録部は、前記AI出力情報と前記フィードバック情報とを履歴情報として前記記憶手段に記録し、前記報酬モデル学習部は、前記履歴情報に基づいて報酬モデルを学習させる、情報処理装置。
[2][1]に記載の情報処理装置であって、前記制御手段は、入力情報取得部をさらに備え、前記入力情報取得部は、前記入力者から前記コンテンツ生成システムへの入力者入力情報及び前記コンテンツ生成システムから前記生成AIへのシステム入力情報の少なくとも一方を取得し、前記履歴情報記録部は、前記AI出力情報及び前記フィードバック情報に加えて、前記入力者入力情報及び前記システム入力情報の少なくとも一方を前記履歴情報として前記記憶手段に記録し、前記報酬モデル学習部は、当該履歴情報に基づいて前記報酬モデルを学習させる、情報処理装置。
[3][2]に記載の情報処理装置であって、前記入力情報取得部及び前記フィードバック情報取得部は、予め前記コンテンツ生成システムにAPIを提供しておき、当該APIを用いて、前記コンテンツ生成システムから、前記入力者入力情報及び前記システム入力情報の少なくとも一方と、前記フィードバック情報とをそれぞれ取得する、情報処理装置。
[4][1]~[3]のいずれかに記載の情報処理装置であって、前記出力情報取得部は、予め前記コンテンツ生成システムにAPIを提供しておき、当該APIを用いて前記コンテンツ生成システムから前記AI出力情報を取得する、情報処理装置。
[5][1]~[4]のいずれかに記載の情報処理装置であって、前記制御手段は、出力情報提示部をさらに備え、前記出力情報提示部は、前記出力情報検証部の検証結果に基づいて、前記システム出力情報とともに、又は前記システム出力情報に代えて、前記検証結果を前記入力者に提示する、情報処理装置。
[6][1]~[5]のいずれかに記載の情報処理装置であって、前記報酬モデル学習部は、学習フェーズにおいて、前記AI出力情報と当該AI出力情報に対する評価とに基づいて前記報酬モデルを予め学習させ、前記出力情報検証部は、提供フェーズにおいて、前記報酬モデルを用いて前記AI出力情報を検証し、前記報酬モデル学習部は、前記提供フェーズにおいて、前記履歴情報に基づいて前記報酬モデルを更新する、情報処理装置。
[7][6]に記載の情報処理装置であって、前記制御手段は、入力情報取得部をさらに備え、前記入力情報取得部は、前記学習フェーズにおいて、前記入力者から前記コンテンツ生成システムへの入力者入力情報及び前記コンテンツ生成システムから前記生成AIへのシステム入力情報の少なくとも一方を取得し、前記報酬モデル学習部は、前記学習フェーズにおいて、前記入力者が入力する学習用データセットについての前記入力者入力情報及び前記システム入力情報の少なくとも一方と、これに対する前記AI出力情報と、当該AI出力情報に対する評価とに基づいて前記報酬モデルを学習させる、情報処理装置。
[8][6]又は[7]に記載の情報処理装置であって、前記出力情報検証部は、前記提供フェーズにおいて、前記報酬モデルを用いた検証に加えて、前記AI出力情報の有害性、正確性及び感情の少なくとも1つをさらに検証する、情報処理装置。
[9][2]又は[3]に記載の情報処理装置であって、前記制御手段は、入力情報検証部をさらに備え、前記入力情報検証部は、前記入力者入力情報の有害性及び感情の少なくとも1つを検証する、情報処理装置。
[10][1]~[9]のいずれかに記載の情報処理装置であって、前記報酬モデル学習部は、単一入力者ごと又は同じグループに所属する複数の入力者ごとに前記報酬モデルを学習させる、情報処理装置。
[11][1]~[10]のいずれかに記載の情報処理装置であって、前記生成AIは大規模言語モデルであり、前記コンテンツ生成システムは文章生成システムである、情報処理装置。
[12]生成AIを用いたコンテンツ生成システムを検証する情報処理方法であって、出力情報取得処理と、出力情報検証処理と、フィードバック情報取得処理と、履歴情報記録処理と、報酬モデル学習処理とを行い、前記出力情報取得処理では、前記コンテンツ生成システムへプロンプトを入力する入力者からの入力に対する前記生成AIからのAI出力情報を取得し、前記出力情報検証処理では、前記AI出力情報を検証し、前記フィードバック情報取得処理では、前記コンテンツ生成システムからのシステム出力情報に対する前記入力者からのフィードバック情報を取得し、前記履歴情報記録処理では、前記AI出力情報と前記フィードバック情報とを履歴情報として記憶手段に記録し、前記報酬モデル学習処理では、前記履歴情報に基づいて報酬モデルを学習させる、情報処理方法。
[13]生成AIを用いたコンテンツ生成システムを検証するプログラムであって、コンピュータに、出力情報取得処理と、出力情報検証処理と、フィードバック情報取得処理と、履歴情報記録処理と、報酬モデル学習処理とを実行させ、前記出力情報取得処理では、前記コンテンツ生成システムへプロンプトを入力する入力者からの入力に対する前記生成AIからのAI出力情報を取得し、前記出力情報検証処理では、前記AI出力情報を検証し、前記フィードバック情報取得処理では、前記コンテンツ生成システムからのシステム出力情報に対する前記入力者からのフィードバック情報を取得し、前記履歴情報記録処理では、前記AI出力情報と前記フィードバック情報とを履歴情報として記憶手段に記録し、前記報酬モデル学習処理では、前記履歴情報に基づいて報酬モデルを学習させる、プログラム。
【発明の効果】
【0007】
本発明によれば、生成AIを用いたコンテンツ生成システムの信頼性を向上させることが可能となっている。
【図面の簡単な説明】
【0008】
【
図1】本発明の第1実施形態に係る情報処理装置100を含むシステムの全体構成を示す図である。
【
図2】
図2Aは、
図1の情報処理装置100のハードウェア構成を示すブロック図であり、
図2Bは、ユーザ端末400のハードウェア構成を示すブロック図である。
【
図3】
図2Aの情報処理装置100の制御手段1の機能構成を示すブロック図である。
【
図4】ユーザUがコンテンツ生成システム200を使用する際の、ユーザ端末400、コンテンツ生成システム200、生成AI300及び情報処理装置100の間で行われる処理を示すシーケンス図である。
【
図5】
図1のユーザ端末400の表示手段405に表示される、コンテンツ生成システム200の出力する比較画面例D1である。
【
図6】
図1のユーザ端末400の表示手段405に表示される、コンテンツ生成システム200の出力する画面例D2である。
【
図7】
図1のユーザ端末400の表示手段405に表示される、コンテンツ生成システム200の出力する比較画面例D3である。
【
図8】
図1のユーザ端末400の表示手段405に表示される、情報処理装置100の出力する画面例D4である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。また、各特徴について独立して発明が成立する。
【0010】
1.第1実施形態
1.1 情報処理装置100を含むシステムの全体構成
図1は、本発明の一実施形態に係る情報処理装置100及び、これを適用するコンテンツ生成システム200、生成AI300、さらにはコンテンツ生成システム200を用いるユーザUが使用するユーザ端末400を含むシステムの全体構成を示す図である。ここで、本実施形態に係る情報処理装置100が適用される生成AI300は、LLM(大規模言語モデル)であり、コンテンツ生成システム200は、当該生成AI300を用いてコンテンツとしての文章を生成する文章生成システムである。
【0011】
LLMは、より具体的には、大量のテキストデータから学習し、人間が書くようなテキストを生成するAIであり、例えば、文章の補完、質問への回答、エッセイの作成など、プロンプトとして入力した指示や質問に対して、レスポンスとして文章を返してくれるものである。
【0012】
また、コンテンツ生成システム200は、より具体的には、ユーザ端末400を介して入力者としてのユーザUからユーザ入力情報(入力者入力情報)の入力を受け付け、当該入力者入力情報を適宜加工したうえでシステム入力情報として生成AI300に送信し、生成AIからAI出力情報を取得して、これをシステム出力情報としてユーザUに提供するものである。また、本実施形態の情報処理装置100を適用するコンテンツ生成システム200としては、例えば、コールセンター、営業部門、技術部門など、同じ業種等の組織ごとに作成又はカスタマイズされたものが挙げられる。カスタマイズのためには、回答マニュアルや業務マニュアル等、組織独自のデータが取り込まれ、ユーザ入力情報を加工してシステム入力情報とする際や、AI出力情報を加工してシステム出力情報にする際に用いられる。ただし、コンテンツ生成システム200は、個人ごとにカスタマイズされても良い。
【0013】
そして、本実施形態の情報処理装置100は、このようなコンテンツ生成システム200が不適当な回答文を出力しないか、つまりコンテンツ生成システム200の背後で動作する生成AI300が不適当な回答文を出力しないかを検証するために用いられる装置である。以下、本実施形態の情報処理装置100について具体的に説明する。なお、本実施形態において、これら情報処理装置100、コンテンツ生成システム200、生成AI300及びユーザ端末400はネットワークNを介して接続される。
【0014】
1.2 情報処理装置100のハードウェア構成
図2Aは、情報処理装置100のハードウェア構成を示すブロック図である。
図2Aに示すように、情報処理装置100は、具体的には、制御手段1と、記憶手段2と、通信手段3とを備える。
【0015】
制御手段1は、CPU(Central Processing Unit)等の1以上のプロセッサで構成され、記憶手段2に記憶された所定のプログラムを実行することにより、情報処理装置100全体の動作を制御する。なお、制御手段1は、GPU(Graphics Processing Unit)やDSP(Digital Signal Processor)等の他のプロセッサを含んでいてもよい。また、制御手段1の少なくとも一部は、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)等の集積回路であっても良い。
【0016】
記憶手段2の一部は、例えば、RAM(Random Access Memory)やDRAM(Dynamic Random Access Memory)等で構成されており、制御手段1による各種プログラムに基づく処理の実行時のワークエリア等として用いられる。また、記憶手段2の一部は、例えば、ROM(Read Only Memory)等の不揮発性メモリ、HDD(Hard Disk Drive)又はSSD(Solid State Drive)であり、各種データ及び制御手段1の処理に利用されるプログラム等を保存する。なお、記憶手段2の少なくとも一部は、外部クラウドや分散ストレージから構成されていても良い。
【0017】
記憶手段2に記憶されるプログラムは、例えば、情報処理装置100の基本的な機能を実現するためのOS(Operating System)、各種ハードウェア制御するためのドライバ、各種機能を実現するためのプログラム等であって、本実施形態に係るコンピュータプログラムを含む。
【0018】
また、本実施形態の記憶手段2には、
図2Aに示されるように、履歴情報HS及び報酬モデルRMも記憶されている。履歴情報HSは、システム入力情報と、AI出力情報と、システム出力情報に対するユーザUのフィードバックであるフィードバック情報とを含む情報である。また、報酬モデルRMは、生成AI300の出力(回答)を評価するためのモデルであり、本実施形態では、上記履歴情報HSに基づいて学習される。履歴情報HS及び報酬モデルRMの詳細については、後述する。
【0019】
通信手段3は、例えばNIC(Network Interface Controller)であり、ネットワークNに接続する機能を有する。なお、通信手段3は、NICに代えて又はNICと共に、無線LAN(Local Area Network)に接続する機能、無線WAN(Wide Area Network)に接続する機能、例えばBluetooth(登録商標)等の近距離の無線通信、及び赤外線通信等を可能とする機能を有してもよい。情報処理装置100は、ネットワークNを介してコンテンツ生成システム200及びユーザ端末400と接続され、各種データの送受信を行うことができる。
【0020】
これら制御手段1、記憶手段2及び通信手段3は、バス4を介して相互に電気的に接続されている。したがって、制御手段1は、記憶手段2へのアクセス及び通信手段3を介して、コンテンツ生成システム200やユーザ端末400等との通信等を行うことができる。
【0021】
なお、情報処理装置100は、
図2に示すような1つの装置によって構成される必要はなく、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてもよい。また、記憶手段2が記憶する各種データ(情報)も、図示のように1つのデータベースで構成される必要はなく、分散データベースによって構成されても良い。
【0022】
1.3 ユーザ端末400のハードウェア構成
図2Bは、ユーザ端末400のハードウェア構成を示すブロック図である。ユーザ端末400は、コンテンツ生成システム200を用いるユーザUが用いる端末であり、例えば、パーソナルコンピュータ(PC)、スマートフォンやタブレット端末、車載端末等の情報処理端末とされる。
図2Bに示すように、ユーザ端末400は、具体的には、制御手段401と、記憶手段402と、通信手段403と、入力手段404と、表示手段405とを備える。これらの各構成は、バス406を介して相互に電気的に接続されている。
【0023】
制御手段401、記憶手段402及び通信手段403の一般的な構成は、上述した情報処理装置100のものと同じであるため、その説明を省略する。
【0024】
入力手段404は、ユーザUの入力を受け付ける装置であり、マウス、キーボード、タッチパネル、マイクロフォン等の各種入力手段で構成される。表示手段405は、液晶ディスプレイやタッチパネルディスプレイ等であり、ユーザUに対し画像等を表示する。
【0025】
1.4 情報処理装置100の(制御手段1)の機能構成
図3に示すように、情報処理装置100の制御手段1は、入力情報取得部10と、出力情報取得部11と、フィードバック情報取得部12と、履歴情報記録部13と、報酬モデル学習部14と、出力情報提示部15と、入力情報検証部16と、出力情報検証部17とを備える。本実施形態の情報処理装置100は、これらの機能構成により、コンテンツ生成システム200(生成AI300)が不適当な回答文を出力しないかを検証する。以下、各機能構成について説明する。
【0026】
なお、本実施形態において、情報処理装置100による検証機能は、APIを介してコンテンツ生成システム200と情報をやり取りすることで提供される。また、
図1及び以下の説明において、「ユーザ入力情報」「システム入力情報」「AI出力情報」「システム出力情報」「フィードバック情報」はそれぞれ、文脈に応じて、ユーザUが入力し又はユーザUに提示される自然言語そのものを指すこともあり、送受信あるいは記憶手段2に記録するために電子化(符号化)されたものを指すこともある。さらには、これらの情報は、暗号化されていることも好適である。
【0027】
入力情報取得部10は、入力情報取得処理(
図4のステップS4参照)として、API(Application Programming Interface)を用いて、コンテンツ生成システム200から生成AI300へのシステム入力情報を取得する。具体的には、入力情報取得部10は、予めコンテンツ生成システム200にAPIを提供しておき、コンテンツ生成システム200が生成AI300へシステム入力情報を送信すると、同時に又はその前後のタイミングでコンテンツ生成システム200に情報処理装置100への当該システム入力情報の送信も実行させる。
【0028】
出力情報取得部11は、出力情報取得処理(
図4のステップS10参照)として、APIを用いて、生成AI300からコンテンツ生成システム200へのAI出力情報を取得する。具体的には、出力情報取得部11は、予めコンテンツ生成システム200にAPIを提供しておき、コンテンツ生成システム200が生成AI300からAI出力情報を取得すると、同時に又はその後のタイミングでコンテンツ生成システム200に情報処理装置100への当該AI出力情報の送信を実行させる。
【0029】
フィードバック情報取得部12は、フィードバック情報取得処理(
図4のステップS18参照)として、APIを用いて、システム出力情報に対するユーザUからのフィードバック情報を取得する。具体的には、フィードバック情報取得部12は、予めコンテンツ生成システム200にAPIを提供しておき、コンテンツ生成システム200がユーザ端末400からフィードバック情報を取得すると、同時に又はその後のタイミングでコンテンツ生成システム200に情報処理装置100への当該フィードバック情報の送信を実行させる。なお、フィードバック情報とは、コンテンツ生成システム200がユーザ端末400の表示手段405を介してユーザUに提示したシステム出力情報、言い換えると、ユーザUが入力したプロンプトに対するレスポンスについてのユーザUによる評価の情報である。本実施形態において、フィードバック情報は、具体的には例えば、「良い/悪い」の2段階の評価(無回答を含めると3段階の評価)の情報とされる。ただし、それ以上の多段階の評価(例えば、0点~100点といった数値での評価)であっても良く、文章による評価であっても良い。
【0030】
履歴情報記録部13は、履歴情報記録処理(
図4のステップS5,S11及びS19参照)として、入力情報取得部10が取得したシステム入力情報、出力情報取得部11が取得したAI出力情報及び、フィードバック情報取得部12が取得したフィードバック情報を、履歴情報HSとして記憶手段2に記録する。より具体的には、履歴情報記録部13は、ユーザUがプロンプトを入力してレスポンスを得、当該レスポンスに対するフィードバックをする一連の流れにおいて取得したシステム入力情報、AI出力情報及びフィードバック情報を関連付けて、履歴情報HSとして記録する。
【0031】
報酬モデル学習部14は、報酬モデル学習処理(
図4のステップS20参照)として、履歴情報記録部13が記録した履歴情報HSに基づいて報酬モデルRMを学習させる。本実施形態において、報酬モデルRMの学習には、学習フェーズにおける事前学習と提供フェーズにおける更新が含まれる。ここで、学習フェーズにおける事前学習は、主にユーザUがコンテンツ生成システム200を使用する前の報酬モデルRMの学習であり、提供フェーズにおける更新は、ユーザUが実際にコンテンツ生成システム200を使用するなかでの報酬モデルRMの更新である。
【0032】
学習フェーズにおける事前学習は、具体的には、コンテンツ生成システム200の開発者やコンテンツ生成システム200を運用する運用者、コンテンツ生成システム200のβ版ユーザ、さらには本実施形態に係る情報処理装置100の提供者など、ユーザUとは別の入力者に学習用データセットとして多数のプロンプト(最低でも数百件のプロンプト)を入力させ、当該入力者からプロンプト(つまりシステム入力情報)ごとにAI出力情報及びシステム出力情報に対する評価(フィードバック情報)を得ることで実施される。ここで、フィードバックをもらう入力者は1人であってもよく、2人以上であっても良い。ただし、1つの報酬モデルRMは、単一入力者ごと又は同じ目的でコンテンツ生成システム200を使用する組織(グループ)に所属する複数の入力者ごとに作成され、学習される。また、人間ではなく、他の生成AIに評価をさせることで報酬モデルRMを学習させるようなことも考えられる。
【0033】
一方、提供フェーズにおける更新は、具体的には、ユーザUがコンテンツ生成システム200を使用して履歴情報HSが追加されるごと、つまり、ユーザUがプロンプトを入力してレスポンスを得、当該レスポンスに対するフィードバックをする一連の流れごと、あるいは履歴情報HSが所定量蓄積されるごと(例えば、100回のフィードバックが得られるごと)に実行される。
【0034】
出力情報提示部15は、出力情報検証部17の検証結果に基づいて、出力情報提示処理として、ユーザ端末400の表示手段405を介し、システム出力情報とともに、又はシステム出力情報に代えて、出力情報検証部17による検証結果をユーザUに提示する(
図6の警告文Wを参照)。ここで、「システム出力情報に代えて」というのは、出力情報検証部17の検証結果が好ましくなくユーザUにシステム出力情報を提示するべきではないと判断した場合には、当該システム出力情報は表示手段405に表示させないということである。なお、具体的な検証結果の提示の方法については、後述する。また、出力情報提示部15は、履歴情報HSに基づき、コンテンツ生成システム200の入出力の統計情報を提示する(
図8参照)。
【0035】
入力情報検証部16は、入力情報検証処理(
図4のステップS6参照)として、入力情報取得部10が取得したユーザ入力情報を検証する。本実施形態の入力情報検証部16は、具体的には、
図3に示すように、入力有害性フィルタ16aと入力感情フィルタ16bとを備え、ユーザ入力情報の有害性及び感情を検証するよう構成される。ここで、「ユーザ入力情報の有害性」とは、ユーザ入力の中に差別や偏見など不適切な用語や表現が含まれる状態のことであり、「ユーザ入力情報の感情」とは、ユーザ入力から推測されるポジティブな感情表現あるいはネガティブな感情表現のことである。なお、入力情報検証部16は、入力有害性フィルタ16aと入力感情フィルタ16bのいずれかのみを備えていても良い。また、入力情報検証部16は、これら以外のフィルタを追加で備えていても良い。
【0036】
出力情報検証部17は、出力情報検証処理(
図4のステップS13参照)として、出力情報取得部11が取得したAI出力情報を検証する。本実施形態の出力情報検証部17は、具体的には、
図3に示すように、出力有害性フィルタ17aと、出力感情フィルタ17bと、ファクトチェックフィルタ17cと、報酬モデルフィルタ17dとを備える。出力有害性フィルタ17aは、AI出力情報の有害性を検証し、出力感情フィルタ17bは、AI出力情報の感情を検証する。ここで、「AI出力情報の有害性」とは、AI出力の中に差別や偏見など不適切な用語や表現が含まれる状態のことであり、「AI出力情報の感情」とは、AI出力から推測されるポジティブな感情表現あるいはネガティブな感情表現のことである。また、ファクトチェックフィルタ17cは、AI出力情報の内容が事実に沿ったものであるか(正確性)を検証するものであり、事実との一致度合いが出力される。加えて、報酬モデルフィルタ17dは、報酬モデルRMを用いてAI出力情報を検証する。報酬モデルフィルタ17dは、具体的には、システム入力情報に対してコンテンツ生成システム200が出力するシステム出力情報(基本的に生成AI300が出力するAI出力情報と同じもの)を評価(例えば、0点~1点での数値評価)する。ただし、報酬モデルフィルタ17dによるシステム出力情報の評価は、例えば、A,B,Cなどのクラス分けとすることもできる。報酬モデルフィルタ17dによるAI出力情報の検証については、後述する。なお、出力情報検証部17は、出力感情フィルタ17b、ファクトチェックフィルタ17c及び報酬モデルフィルタ17dの少なくとも1つを備えていなくても良い。また、出力情報検証部17は、これら以外のフィルタを追加で備えていても良い。
【0037】
なお、上述した各機能構成及び処理は、情報処理装置100に適宜インストールされるソフトウェア(いわゆるアプリを含む)によって実現してもよく、ハードウェアによって実現してもよい。ソフトウェアによって実現する場合、制御手段1がソフトウェアを構成するプログラムを実行することによって各種機能を実現することができる。また、単一のソフトウェアではなく、複数のソフトウェアによって実現されていても良い。
【0038】
プログラムを実行することで実現される場合、当該プログラムは、情報処理装置100が内蔵する記憶手段2に格納してもよく、コンピュータが読み取り可能な非一時的な記録媒体に格納してもよい。また、外部の記憶装置に格納されたプログラムを読み出し、いわゆるクラウドコンピューティングにより実現してもよい。もしくは、ハードウェアによって実現する場合、ASIC、SOC、FPGA、又はDRPなどの種々の回路によって実現することができる。また、上述した機能構成のうちの少なくとも一部の機能構成を、ソフトウェア又はハードウェアによって、入力を受け付けるユーザ端末400等で処理されるようにしてもよい。
【0039】
また、上述した機能構成は、複数のコンピュータによって実現してもよく、その場合、上述した各機能構成は、複数のコンピュータに分散して配置してもよい。
【0040】
1.5 情報処理装置100による情報処理方法
次に、
図4のシーケンス図及び
図5~
図8の画面例D1~D4を用いて、本実施形態の情報処理装置100がコンテンツ生成システム200の出力(生成AI300の出力)を検証する情報処理方法を説明する。なお、
図4のシーケンス図には、情報処理装置100の処理だけでなく、ユーザ端末400、コンテンツ生成システム200及び生成AI300の処理も含まれている。また、上述したように、本実施形態の情報処理装置100による検証は、APIを介してコンテンツ生成システム200との間で必要な情報を送受信することで実現される。
【0041】
本実施形態の情報処理方法は、具体的には、まず、ステップS1において、ユーザ端末400が入力手段404を介してユーザUからコンテンツ生成システム200への入力、すなわちプロンプトを受け付ける。次に、ステップS2において、ユーザ端末400は、受け付けたユーザ入力情報をコンテンツ生成システム200に送信する。次に、コンテンツ生成システム200は、ステップS3において、必要に応じてユーザ入力情報を加工する。ここで、コンテンツ生成システム200によるユーザ入力情報の加工には、例えば、ユーザUが入力したプロンプトに、RAG(Retrieval Augmented Generation)の仕組みを使って補足情報を付加する等が考えられる。
【0042】
次に、ステップS4において、コンテンツ生成システム200は、当該加工したユーザ入力情報をシステム入力情報として情報処理装置100に送信し、情報処理装置100の制御手段1の入力情報取得部10は、当該システム入力情報を取得する。
【0043】
次に、制御手段1の履歴情報記録部13は、ステップS5において、入力情報取得部10の取得した履歴情報HSとして記憶手段2に記録する。また、制御手段1の入力情報検証部16は、ステップS6において、システム入力情報を検証し、ステップS7において、システム入力情報の検証結果をコンテンツ生成システム200に送信する。なお、情報処理装置100による検証結果をどのように活用するかは、コンテンツ生成システム200側で自由に設定できる。例えば、入力に有害な言葉や文が含まれた場合に、ユーザUに警告することや、当該ユーザUからの入力の生成AI300への送信をブロックするなどが想定される。
【0044】
次に、コンテンツ生成システム200は、ステップS8において、システム入力情報の検証結果が当該システム入力情報を生成AI300に送信するべきではないというものでない限り、当該システム入力情報を生成AI300に送信する。生成AI300は、ステップS9において、プロンプトとしてシステム入力情報を受け取り、レスポンスとしてAI出力情報をコンテンツ生成システム200に送信する。
【0045】
次に、ステップS10において、コンテンツ生成システム200は、生成AI300から取得したAI出力情報を情報処理装置100に送信し、情報処理装置100の制御手段1の出力情報取得部11は、当該AI出力情報を取得する。
【0046】
次に、制御手段1の履歴情報記録部13は、ステップS11において、出力情報取得部11の取得したAI出力情報を履歴情報HSとして記憶手段2に記録する。また、制御手段1の出力情報検証部17は、ステップS12において、AI出力情報を検証し、ステップS13において、検証結果をコンテンツ生成システム200に送信する。
【0047】
次に、コンテンツ生成システム200は、ステップS14において、情報処理装置100から取得したAI出力情報の検証結果に基づいてAI出力情報を加工し、ユーザ端末400に送信するシステム出力情報を生成する。生成されたシステム出力情報は、ステップS15においてユーザ端末400に送信され、表示手段405に表示される。
【0048】
なお、
図5は、ユーザUがコンテンツ生成システム200のプロンプト入力欄A1に「日本で最も小さい都道府県はどこですか?」と質問し、レスポンス欄A2に「最も小さい都道府県は北海道です。」と回答が表示された比較画面例D1である。ここで、最も小さい都道府県は実際には北海道ではないので、この回答は適切ではない回答と言える。生成AI300がAI出力情報としてこのような回答を出力した場合、情報処理装置100の出力情報検証部17は、例えば当該AI出力情報をハルシネーション(つまり、もっともらしい誤情報)の可能性がある出力であると判断し、出力情報提示部15は、当該検証結果をコンテンツ生成システム200に送信する。これにより、コンテンツ生成システム200は、
図6の画面例D2に示すように、AI出力情報を加工し、ハルシネーションの可能性のある出力である旨の注意喚起の警告文Wを追加したシステム出力情報を生成することが可能となる。
【0049】
また、
図7は、
図5のような生成AI300の誤った回答に対してユーザUがプロンプト入力欄A1にて誤りを指摘した結果、生成AI300がAI出力情報としてユーザUに対して有害な回答(悪口)をした例を示す比較画面例D3である。生成AI300がAI出力情報としてこのような回答を出力した場合、情報処理装置100の出力情報検証部17は、例えば当該AI出力情報をユーザUに提示するべきではない出力であると判断し、当該検証結果をコンテンツ生成システム200に送信する。これにより、コンテンツ生成システム200は、ユーザUに対して有害な回答を提示することを回避することが可能となる。この場合、コンテンツ生成システム200は、AI出力情報に代えて、例えば、問題のある出力であったため出力内容を表示することはできない旨のシステム出力情報を生成することができる。
【0050】
次に、ステップS16において、ユーザ端末400は、入力手段404を介してユーザUからシステム出力情報に対するフィードバック(例えば、良い/悪いの2段階評価)を受け付ける。そして、ステップS17において、ユーザ端末400は、受け付けたフィードバック情報をコンテンツ生成システム200に送信する。コンテンツ生成システム200は、ステップS18において当該フィードバック情報を情報処理装置100に送信し、制御手段1のフィードバック情報取得部12は、当該フィードバック情報を取得する。
【0051】
次に、制御手段1の履歴情報記録部13は、ステップS19において、フィードバック情報取得部12の取得したフィードバック情報を履歴情報HSとして記憶手段2に記録する。なお、履歴情報記録部13は、ステップS5におけるシステム入力情報、ステップS11におけるAI出力情報及びこのステップS19におけるフィードバック情報を関連付けて記録するようになっている。
【0052】
最後に、ステップS20において、制御手段1の報酬モデル学習部14は、記録された履歴情報HSに基づいて、報酬モデルRMを更新する。
【0053】
以上のようなステップS1~S20の一連のステップにより、本実施形態の情報処理方法では、ユーザUがコンテンツ生成システム200を使用してフィードバックを提供する度に、あるいは履歴情報HSが所定量蓄積された度に、報酬モデルRMが更新されるようになっている。
【0054】
なお、情報処理装置100の出力情報提示部15は、
図8に示すように、記録された履歴情報HSに基づいて、コンテンツ生成システム200の入出力の最新の統計情報をWebページや電子メール等でユーザUに提示することも可能である。
図8に示す画面例D4では、AI出力情報の有害性(テキストの有害性)についての統計データが示されている。
【0055】
1.6 作用効果
(1)本実施形態に係る情報処理装置100によれば、出力情報取得部11が生成AI300からのAI出力情報を取得し、出力情報検証部17が報酬モデルRMに基づいてAI出力情報を検証するようになっている。そして、フィードバック情報取得部12が、コンテンツ生成システム200を介してユーザUからのシステム出力情報に対するフィードバック情報を取得し、履歴情報記録部13がAI出力情報とともにフィードバック情報を履歴情報HSとして記録し、報酬モデル学習部14が当該履歴情報HSに基づいて報酬モデルRMを学習・更新するようになっている。本実施形態に係る情報処理装置100は、このような構成となっていることから、フィードバック情報により日々更新される報酬モデルRMに基づいて出力情報検証部17によるコンテンツ生成システム200(システム出力情報)の検証を行うことができ、日々変化する社会の中でのコンテンツ生成システム200の信頼性を向上させることが可能となっている。
【0056】
(2)本実施形態に係る情報処理装置100は、入力情報取得部10がシステム入力情報を取得し、AI出力情報及びフィードバック情報とともに履歴情報HSとして記録して、報酬モデル学習部14が当該履歴情報HSに基づいて報酬モデルRMを学習・更新するようになっている。このように、報酬モデルRMの学習及び更新にシステム入力情報も用いることで、報酬モデルRMの学習・更新の精度を向上させることが可能となっている。
【0057】
(3)本実施形態に係る情報処理装置100は、入力情報取得部10、出力情報取得部11及びフィードバック情報取得部12がそれぞれAPIを介してコンテンツ生成システム200から対応する情報を取得するよう構成されている。これにより、生成AI300やユーザ端末400から直接情報を取得できない場合でも、出力情報検証部17によるコンテンツ生成システム200の検証及び報酬モデルRMを学習・更新を行うことが可能となっている。なお、APIの設計によりコンテンツ生成システム200が情報処理装置100に各情報を提供する際に、当該情報を暗号化(ベクトル化)するようにすることも好適である。これにより、コンテンツ生成システム200の開発者や運用者、各ユーザUは、安心して情報処理装置100を利用することが可能である。
【0058】
(4)本実施形態に係る情報処理装置100は、出力情報提示部15が、コンテンツ生成システム200によるシステム出力情報とともに、又はシステム出力情報に代えて、出力情報検証部17による検証結果をユーザUが用いるユーザ端末400の表示手段405に表示するようになっている。これにより、コンテンツ生成システム200のユーザUは、コンテンツ生成システム200によるレスポンス(あるいは、生成AIによるレスポンス)が信頼できるものであるかを判断することができる。
【0059】
(5)本実施形態に係る情報処理装置100は、報酬モデル学習部14が学習フェーズにおいて学習用データセットにより報酬モデルRMを予め学習させ、その後の提供フェーズにおいて、出力情報検証部17が学習させた報酬モデルRMを用いて前記AI出力情報を検証するよう構成されている。これにより、情報処理装置100を適用したコンテンツ生成システム200のユーザUへの提供の当初から、ユーザU向けにカスタマイズされた検証結果を出力することが可能となっている。
【0060】
(6)本実施形態に係る情報処理装置100において、制御手段1は、出力情報検証部17が報酬モデルフィルタ17dに加えて出力有害性フィルタ17a、出力感情フィルタ17b及びファクトチェックフィルタ17cも備えている。これにより、ユーザUのフィードバックに基づいてチューニングされる報酬モデルフィルタ17dによる検証に限らない、総合的な検証を行うことが可能となっている。
【0061】
(7)さらに、本実施形態の制御手段1は、入力有害性フィルタ16aと入力感情フィルタ16bとを備えた入力情報検証部16も備えており、適切ではないユーザ入力情報及びこれに基づいたAI出力情報(システム出力情報)と、これに対するフィードバック情報とにより、報酬モデルRMが適切でない学習をしてしまうことを回避することが可能となっている。加えて、適切ではない入力からコンテンツ生成システム200を保護することも可能となっている。
【0062】
(8)本実施形態において、報酬モデル学習部14は、単一ユーザUごと又は同じ目的でコンテンツ生成システム200を使用するグループに所属する複数のユーザU(入力者)ごとに報酬モデルRMを作成し、事前学習及び更新するようになっている。これにより、報酬モデルRMは単一ユーザあるいはグループの目的に沿うよう生成・更新されるため、検証結果が微調整され、すべてのユーザUが同じ報酬モデル(汎用の報酬モデル)を用いる場合と比較して、使用するユーザUに精度の高い検証結果を提供することが可能となっている。
【0063】
(9)本実施形態において、情報処理装置100を適用するコンテンツ生成システム200は文章生成システムであり、生成AI300はLLM(大規模言語モデル)である。ここで、LLMやこれを用いた文章生成システムによる不適切なレスポンス(回答)は、不適切性が取り上げられやすいため、近年特に問題となっている。そして、外部のLLMサービスを用いるコンテンツ生成システム200の開発者や運用者等は、不適切なレスポンスが報告されると、LLMサービス側で対応がなされるまでシステムの提供中止を余儀なくされたり、システム側での問題に対する対応に追われたりするおそれがあった。この点、本実施形態に係る情報処理装置100によれば、コンテンツ生成システム200でも生成AI300でもない第3者の立場でコンテンツ生成システム200及び生成AI300の出力を検証するとともに、報酬モデルRMを日々更新するようになっている。これにより、コンテンツ生成システム200開発者や運用者等が自ら不適切なレスポンスに対応しなくても、安心してシステムを提供することが可能となっている。
【0064】
3.変形例
なお、本発明は、以下の態様でも実施可能である。
【0065】
上記実施形態において、情報処理装置100は、生成AI300を用いたコンテンツ生成システム200として、LLM(大規模言語モデル)を用いた文章生成システムを検証するよう構成されていた。しかしながら、本発明の情報処理装置100は、画像を生成するAIを用いた画像生成システムや動画を生成するAIを用いた動画生成システム、さらには、音楽を生成するAIを用いた音楽生成システムを検証するものであっても良い。
【0066】
上記実施形態において、情報処理装置100は、履歴情報記録部13が履歴情報HSとして、出力情報取得部11の取得したAI出力情報に加えて入力情報取得部10の取得したユーザ入力情報も、フィードバック情報取得部12の取得したフィードバック情報とともに記録し、当該履歴情報HSに基づいて報酬モデル学習部14が報酬モデルRMを学習及び更新するよう構成されていた。しかしながら、履歴情報記録部13がAI出力情報とフィードバック情報に基づいて、すなわち、ユーザ入力情報には基づかずに報酬モデルRMを学習及び更新するようにしても良い。
【0067】
本実施形態の入力情報取得部10は、コンテンツ生成システム200が生成AI300に送信する加工済みのプロンプトをAI入力情報として取得するよう構成されていた。しかしながら、入力情報取得部10は、これに代えて、ユーザ端末400がコンテンツ生成システム200に送信する生のプロンプト(ユーザUが入力したプロンプトそのもの)をAI入力情報として取得しても良い。この場合、報酬モデルRMは、AI出力情報及びフィードバック情報に加えて、当該情報に基づいて学習、更新される。
【0068】
上記実施形態において、入力情報取得部10、出力情報取得部11及びフィードバック情報取得部12は、それぞれAPIを介してコンテンツ生成システム200から対応する情報を取得するよう構成されていた。しかしながら、本発明に係る入力情報取得部10、出力情報取得部11及びフィードバック情報取得部12の情報の取得方法はこれに限定されない。例えば、入力情報取得部10とフィードバック情報取得部12の少なくとも一方が、ユーザ端末400からネットワークNを介して直接対応する情報を取得しても良い。例えば、Webブラウザを介して取得することや、ウィルスソフトのような端末に常駐するアプリケーションを用いて取得することが考えられる。また、出力情報取得部11が生成AI300から直接回答を取得しても良い。さらに、情報処理装置100が直接コンテンツ生成システム200から入力を受け付け、当該入力を生成AI300にプロンプトとして送信するとともに、生成AI300からのレスポンスを情報処理装置100が直接受け付け、当該レスポンスをコンテンツ生成システム200に送信することも可能である。この場合、情報処理装置100は、コンテンツ生成システム200と生成AI300の間に配置される、コンテンツ生成システム200あるいは生成AI300に対してのいわばファイアウォールとして機能する。
【0069】
上記実施形態では、情報処理装置100の出力情報取得部11がAI出力情報を取得し、AI出力情報をユーザ入力情報及びフィードバック情報とともに履歴情報HSとして記録して報酬モデルRMの学習に用いていた。しかしながら、出力情報取得部11がAI出力情報に代えてシステム出力情報を取得して、履歴情報HSとして記録して報酬モデルRMの学習に用いることも可能である。ただし、システム出力情報に情報処理装置100の出力情報提示部15が送信した検証結果がすでに含まれている場合、これを出力情報検証部17が再度検証するとループが発生してしまうため、システム出力情報から生成AI300の出力のみを抽出して検証等を実行することが必要である。
【0070】
上記実施形態では、出力情報提示部15は、出力情報検証部17による検証結果をコンテンツ生成システム200に送信し、コンテンツ生成システム200のシステム上でAI出力情報を加工して警告文Wを表示させる構成であった(
図6参照)。しかしながら、出力情報検証部17による検証結果は、コンテンツ生成システム200とは別に、例えばWebブラウザやポップアップ、プッシュ通知等により表示させることも可能である。また、コンテンツ生成システム200のシステム上に表示させ、さらに、Webブラウザ等で別途統計データとともに確認できるようにすることも好適である。
【0071】
上記実施形態の報酬モデル学習部14は、情報処理装置100をコンテンツ生成システム200に適用した後、当該コンテンツ生成システム200がユーザUに提供される前に報酬モデルRMを事前学習させていた。しかしながら、本発明に係る情報処理装置100は、報酬モデルRMを事前学習させずにユーザUに提供することも可能である。この場合、ユーザUからのフィードバックのみにより報酬モデルRMが学習されることになる。
【0072】
上記実施形態において、情報処理装置100は、入力情報取得部10によるシステム入力情報の取得と出力情報取得部11によるAI出力情報の取得とを異なるタイミング(ステップS4/ステップS10)で実行していた。しかしながら、システム入力情報の取得とAI出力情報の取得とを同時に行うことも可能である。この場合、その後のシステム入力情報及びAI出力情報の履歴情報HSとしての記録及び検証も、同時に実行することができる。
【0073】
上記実施形態では、システム出力情報のうち、生成AI300による回答(AI出力情報)に対してユーザUからフィードバックをもらうことが想定されていたが、これとは別に、出力情報提示部15が提提示した出力情報検証部17による検証結果に対してもフィードバックをもらうようにしても良い。
【0074】
上記実施形態において、情報処理装置100は、コンテンツ生成システム200とネットワークNを介して接続され、いわゆるウェブサービスとしてコンテンツ生成システム200(生成AI300)の検証を行うものであった。しかしながら、情報処理装置100は、コンテンツ生成システム200と同じローカルネットワーク上あるいは同じプライベートクラウド上にオンプレミスで構成されても良い。
【0075】
上記実施形態において、コンテンツ生成システム200及び生成AI300は、それぞれユーザ端末400とネットワークNを介して接続され、ユーザUに各種機能を提供するものであった。しかしながら、これらコンテンツ生成システム200及び生成AI300はそれぞれ、ユーザ端末400、具体的には、PC・携帯端末・自動車・医療機器などのローカルデバイス上に搭載された集積回路上で動くシステム、いわゆるエッジAIとして提供されるものであっても良い。この場合、情報処理装置100も、少なくとも一部の機能要素をこれらと同じユーザ端末400(ローカルデバイス)上にオンプレミスで配置することができる。また、生成AI300がネットワークN上にあり、コンテンツ生成システム200のみがユーザ端末400上にある場合も、情報処理装置100をコンテンツ生成システム200と同じデバイス上にオンプレミスで設置することが可能である。
【符号の説明】
【0076】
1 :制御手段
2 :記憶手段
3 :通信手段
4 :バス
10 :入力情報取得部
11 :出力情報取得部
12 :フィードバック情報取得部
13 :履歴情報記録部
14 :報酬モデル学習部
15 :出力情報提示部
16 :入力情報検証部
16a :入力有害性フィルタ
16b :入力感情フィルタ
17 :出力情報検証部
17a :出力有害性フィルタ
17b :出力感情フィルタ
17c :ファクトチェックフィルタ
17d :報酬モデルフィルタ
100 :情報処理装置
200 :コンテンツ生成システム
300 :生成AI
400 :ユーザ端末
401 :制御手段
402 :記憶手段
403 :通信手段
404 :入力手段
405 :表示手段
406 :バス
A1 :プロンプト入力欄
A2 :レスポンス欄
HS :履歴情報
N :ネットワーク
RM :報酬モデル
U :ユーザ
W :警告文
【要約】
【課題】生成AIを用いたコンテンツ生成システムの信頼性を向上させるための情報処理装置を提供する。
【解決手段】本発明によれば、生成AIを用いたコンテンツ生成システムを検証する情報処理装置であって、制御手段と、記憶手段とを備え、前記制御手段は、出力情報取得部と、出力情報検証部と、フィードバック情報取得部と、履歴情報記録部と、報酬モデル学習部と、を備え、前記出力情報取得部は、前記コンテンツ生成システムへプロンプトを入力する入力者からの入力に対する前記生成AIからのAI出力情報を取得し、前記出力情報検証部は、前記AI出力情報を検証し、前記フィードバック情報取得部は、前記コンテンツ生成システムからのシステム出力情報に対する前記入力者からのフィードバック情報を取得し、前記履歴情報記録部は、前記AI出力情報と前記フィードバック情報とを履歴情報として前記記憶手段に記録し、前記報酬モデル学習部は、前記履歴情報に基づいて報酬モデルを学習させる、情報処理装置が提供される。
【選択図】
図1