IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

2025-25577因果推論装置、因果推論方法及び因果推論プログラム
<>
  • -因果推論装置、因果推論方法及び因果推論プログラム 図1
  • -因果推論装置、因果推論方法及び因果推論プログラム 図2
  • -因果推論装置、因果推論方法及び因果推論プログラム 図3
  • -因果推論装置、因果推論方法及び因果推論プログラム 図4
  • -因果推論装置、因果推論方法及び因果推論プログラム 図5
  • -因果推論装置、因果推論方法及び因果推論プログラム 図6
  • -因果推論装置、因果推論方法及び因果推論プログラム 図7
  • -因果推論装置、因果推論方法及び因果推論プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025025577
(43)【公開日】2025-02-21
(54)【発明の名称】因果推論装置、因果推論方法及び因果推論プログラム
(51)【国際特許分類】
   G06F 16/332 20250101AFI20250214BHJP
【FI】
G06F16/332
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2023130452
(22)【出願日】2023-08-09
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】大坪 悠介
(72)【発明者】
【氏名】尾崎 太亮
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175GC01
(57)【要約】
【課題】ある事象とその結果とを基に、それらの間の過程を網羅性高く生成する。
【解決手段】因果推論装置が、事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成するプロンプト生成部と、前記プロンプトを前記言語モデルに送信するプロンプト送信部と、を備える。
【選択図】図3
【特許請求の範囲】
【請求項1】
事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成するプロンプト生成部と、
前記プロンプトを前記言語モデルに送信するプロンプト送信部と、
を備える因果推論装置。
【請求項2】
前記因果過程および該因果過程における前記他候補生成箇所を示す指示テキストを生成する指示テキスト生成部と、
前記因果過程における前記他候補生成箇所に置き換え可能な他候補を前記言語モデルに質問するための質問テキストを生成する質問テキスト生成部と、
を更に備え、
前記プロンプト生成部は、前記質問テキストと前記指示テキストとを含むように前記プロンプトを生成する、
請求項1に記載の因果推論装置。
【請求項3】
前記言語モデルへ入力する入力テキスト例と所望の出力フォーマットの出力テキスト例とを対にした例題テキストを生成する例題テキスト生成部を更に備え、
前記プロンプト生成部は、前記質問テキストと前記指示テキストと前記例題テキストとを連結して前記プロンプトを生成する、
請求項2に記載の因果推論装置。
【請求項4】
前記プロンプト生成部は、前記例題テキスト、前記質問テキスト、前記指示テキストをその順序で連結して前記プロンプトを生成する、
請求項3に記載の因果推論装置。
【請求項5】
前記言語モデルから出力された因果過程のテキストをユーザに提示する提示部と、
提示した因果過程における他候補生成箇所の指定を前記ユーザから受け付ける指定受付部と、を更に備え、
前記指示テキスト生成部は、前記他候補生成箇所の指定に従って、前記因果過程から前記指示テキストを生成する、
請求項2に記載の因果推論装置。
【請求項6】
前記指定受付部は、前記他候補生成箇所に指定された過程の識別情報を記録し、
前記指示テキスト生成部は、前記識別情報を参照して前記他候補生成箇所を特定する、
請求項5に記載の因果推論装置。
【請求項7】
事象、過程、結果という単位でテキストが区切られ、前記事象、前記過程、および前記結果の間に存在する因果関係およびその方向が第1記号により表現された形式で因果過程を生成する因果過程生成部を更に備え、
前記指示テキスト生成部は、前記因果過程における前記第1記号で区切られた1つ以上の過程のうち他候補生成箇所とする過程を第2記号に置き換えることにより前記指示テキストを生成し、
前記質問テキスト生成部は、前記指示テキストにおける前記第2記号の箇所を他候補に置き換えさせるための質問テキストを生成する、
請求項3に記載の因果推論装置。
【請求項8】
前記例題テキスト生成部は、因果関係を前記第1記号で表現した因果過程における他候補生成箇所を前記第2記号で置き換えた前記入力テキスト例と、前記因果過程における前記他候補生成箇所を置き換え可能な複数の過程を前記出力フォーマットで列挙した前記出力テキスト例とを対にした例題テキストを生成する、
請求項7に記載の因果推論装置。
【請求項9】
前記第1記号が矢印であり、
前記第2記号が疑問符である、
請求項7に記載の因果推論装置。
【請求項10】
網羅的な因果過程を生成する対象とする事象および結果の内容は、予めシステム内部に保持されているか、または、ユーザの入力から受け付けられる、
請求項1に記載の因果推論装置。
【請求項11】
事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成し、
前記プロンプトを前記言語モデルに送信する、
ことをコンピュータが実行する因果推論方法。
【請求項12】
事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成し、
前記プロンプトを前記言語モデルに送信する、
ことをコンピュータに実行させるための因果推論プログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、因果推論装置、因果推論方法及び因果推論プログラムに関する。
【背景技術】
【0002】
社会がwell-beingを重視していく中で、社会福祉の観点で企業が社会や環境に与える影響を加味した企業活動全般に基づいて、企業を評価するようになってきた。特に、企業に対して投資を行う投資家の観点では、財務指標に加えて、環境、社会、企業統治に取り組む企業を重視するESG(Environment Social Governance)投資が注目されている。このようなESG投資を行う投資家をESG投資家という。各社はESG投資家向けに、ESG情報を開示することが多い。ESG情報として、特に、自社の事業が、ESGの観点で、社会にどのようなポジティブまたはネガティブな影響を及ぼし得るか報告することが求められている。ESG情報を開示する文書をESG開示文書という。このようなESG開示文書の作成には、多大な工数がかかる。
【0003】
そこで、近年発展が著しい大規模言語モデル(非特許文献1)を用いて、ESG開示文書の自動作成を行うことが考えられている。特に、自社の事業が、ESGの観点で、社会にどのようなポジティブまたはネガティブな影響を及ぼし得るかを大規模言語モデルを用いて予測することが考えられている。具体的には、企業の事業内容が記載されたテキストを受け取って大規模言語モデルに入力し、その事業がESG指標にどのように影響を与えるか記述したテキストを出力させるシステムが考えられている。ESG指標は、ESGの観点で社会に及ぼす影響を測る指標である。ESG指標の例として温室効果ガスの排出量やその削減量がある。
【0004】
大規模言語モデルを用いて物事の影響を生成する手段の一例を開示する文献として非特許文献2が存在する。非特許文献2には、大規模言語モデルに、ある事象を表すテキストと、その結果を表すテキストを入力し、事象から結果への因果的な過程を生成させる技術が開示されている。
【0005】
一般に、大規模言語モデルは、入力するテキスト(以下、プロンプトと呼ぶ)を工夫することで出力の精度を高めることができる。大規模言語モデルに入力するプロンプトを工夫する手段の一例を開示する文献として特許文献1が存在する。特許文献1に開示されている技術は、対話ボットで、ユーザの返信をプロンプトの中に工夫して取り込む技術である。具体的には、ユーザの返信から話の主題と関連する対話シーンをそのペルソナのデータベースから検索し、「主題」と「対話シーン」をプロンプトに入れ込むという技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2022-180282号公報
【非特許文献】
【0007】
【非特許文献1】Brown, Tom, et al. "Language models are few-shot learners." Advances in neural information processing systems 33 (2020): 1877-1901.
【非特許文献2】Bhagavatula, Chandra, et al. "Abductive commonsense reasoning." arXiv preprint arXiv:1908.05739 (2019).
【発明の概要】
【発明が解決しようとする課題】
【0008】
上記の非特許文献2に開示された技術は、具体的には、事象のテキストと結果のテキストを大規模言語モデルに入力し、尤度を目的関数、潜在変数を変数とした最適化問題を解き、事象から結果への因果関係をつなぐ尤もらしいテキスト(因果過程)を生成させる。
【0009】
ところで、ある事象からある結果が生じるまでの因果的な過程は一通りとは限らない。例えば、鉄道会社が安全運転のための室内シミュレータを開発し、その室内シミュレータを用いて従業員を訓練したという事象から、それが温室効果ガス排出量の削減されたという結果につながったと想定されたとする。その場合、シミュレータを使った訓練により鉄道事故が減少し、それにより、事故車両が運搬していた石炭などの燃料の流出が低減され、それによりエネルギーの浪費が避けられ、それにより温室効果ガス排出量の削減されたという因果的な過程が考えられる。また、シミュレータを使った訓練により鉄道事故が減少し、それにより、事故車両を清掃するのに消費された資源が削減され、それにより温室効果ガス排出量の削減されたという因果的な過程も考えられる。また、シミュレータを使った訓練により鉄道事故が減少し、それにより、事故の際に乗客を避難させる緊急車両の出動の回数が減り、それによりエネルギーの消費が削減され、それにより温室効果ガス排出量の削減されたという因果的な過程も考えられる。
【0010】
しかし、非特許文献2では、目的関数に対する最適化問題を解いている構造上、因果的な過程は最適なもの一通りしか得ることができず、複数存在しうる因果的な過程を網羅することができない。
【0011】
本開示に含まれるひとつの目的は、上記の課題に鑑みて、ある事象とその結果とを基に、それらの間の過程を網羅性高く生成する技術を提供することである。
【課題を解決するための手段】
【0012】
本開示に含まれるひとつの態様による因果推論装置は、事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成するプロンプト生成部と、前記プロンプトを前記言語モデルに送信するプロンプト送信部と、を備える。
【発明の効果】
【0013】
本開示によれば、事象と結果の間の可能な因果関係を網羅的にリストアップできる。
【図面の簡単な説明】
【0014】
図1図1は、本開示の実施形態を実施するためのコンピュータシステムを示す図である。
図2図2は、本開示の実施形態に係る因果推論システムの構成の一例を示す図である。
図3図3は、本開示の実施形態に係る因果推論方法の流れを示すフローチャートである。
図4図4は、本開示の実施形態に係る因果過程の網羅性向上の様子を示す図である。
図5図5は、本開示の実施形態に係る因果過程の網羅性向上の様子を示す図である。
図6図6は、本開示の実施形態に係る因果過程の網羅性向上の様子を示す図である。
図7図7は、本開示の実施形態で利用されるプロンプトの具体例を示す図である。
図8図8は、本開示の実施形態によって生成されるプロンプトの具体例を示す図である。
【発明を実施するための形態】
【0015】
以下、図面を参照して、本発明の実施形態について説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。なお、「第1」、「第2」、「第3」等の用語は、本開示において様々な要素又は構成要素を説明するのに用いられる場合があるが、これらの要素又は構成要素はこれらの用語によって限定されるべきでないことが理解されるであろう。これらの用語は、或る要素又は構成要素を別の要素又は構成要素と区別するためにのみ用いられる。したがって、以下で論述する第1の要素又は構成要素は、本発明概念の教示から逸脱することなく第2の要素又は構成要素と呼ぶこともできる。
【0016】
次に、図1を参照して、本開示の実施形態を実施するためのコンピュータシステム100について説明する。本明細書で開示される様々な実施形態の機構及び装置は、任意の適切なコンピューティングシステムに適用されてもよい。コンピュータシステム100の主要コンポーネントは、1つ以上のプロセッサ102、メモリ104、端末インタフェース112、ストレージインタフェース113、I/O(入出力)デバイスインタフェース114、及びネットワークインタフェース115を含む。これらのコンポーネントは、メモリバス106、I/Oバス108、バスインタフェースユニット109、及びI/Oバスインタフェースユニット110を介して、相互的に接続されてもよい。
【0017】
コンピュータシステム100は、プロセッサ102と総称される1つ又は複数の汎用プログラマブル中央処理装置(CPU)102A及び102Bを含んでもよい。ある実施形態では、コンピュータシステム100は複数のプロセッサを備えてもよく、また別の実施形態では、コンピュータシステム100は単一のCPUシステムであってもよい。各プロセッサ102は、メモリ104に格納された命令を実行し、オンボードキャッシュを含んでもよい。
【0018】
ある実施形態では、メモリ104は、データ及びプログラムを記憶するためのランダムアクセス半導体メモリ、記憶装置、又は記憶媒体(揮発性又は不揮発性のいずれか)を含んでもよい。メモリ104は、本明細書で説明する機能を実施するプログラム、モジュール、及びデータ構造のすべて又は一部を格納してもよい。例えば、メモリ104は、因果推論アプリケーション150を格納していてもよい。ある実施形態では、因果推論アプリケーション150は、後述する機能をプロセッサ102上で実行する命令又は記述を含んでもよい。
【0019】
ある実施形態では、因果推論アプリケーション150は、プロセッサベースのシステムの代わりに、またはプロセッサベースのシステムに加えて、半導体デバイス、チップ、論理ゲート、回路、回路カード、および/または他の物理ハードウェアデバイスを介してハードウェアで実施されてもよい。ある実施形態では、因果推論アプリケーション150は、命令又は記述以外のデータを含んでもよい。ある実施形態では、カメラ、センサ、または他のデータ入力デバイス(図示せず)が、バスインタフェースユニット109、プロセッサ102、またはコンピュータシステム100の他のハードウェアと直接通信するように提供されてもよい。
【0020】
コンピュータシステム100は、プロセッサ102、メモリ104、表示システム124、及びI/Oバスインタフェースユニット110間の通信を行うバスインタフェースユニット109を含んでもよい。I/Oバスインタフェースユニット110は、様々なI/Oユニットとの間でデータを転送するためのI/Oバス108と連結していてもよい。I/Oバスインタフェースユニット110は、I/Oバス108を介して、I/Oプロセッサ(IOP)又はI/Oアダプタ(IOA)としても知られる複数の端末インタフェース112,113,114、及び115と通信してもよい。
【0021】
表示システム124は、表示コントローラ、表示メモリ、又はその両方を含んでもよい。表示コントローラは、ビデオ、オーディオ、又はその両方のデータを表示装置126に提供することができる。
【0022】
表示システム124は、単独のディスプレイ画面、テレビ、タブレット、又は携帯型デバイスなどの表示装置126に接続されてもよい。
【0023】
I/Oインタフェースユニットは、様々なストレージ又はI/Oデバイスと通信する機能を備える。例えば、端末インタフェース112は、ビデオ表示装置、スピーカテレビ等のユーザ出力デバイスや、キーボード、マウス、キーパッド、タッチパッド、トラックボール、ボタン、ライトペン、又は他のポインティングデバイス等のユーザ入力デバイスのようなユーザI/Oデバイス116の取り付けが可能である。ユーザは、ユーザインタフェースを使用して、ユーザ入力デバイスを操作することで、ユーザI/Oデバイス116及びコンピュータシステム100に対して入力データや指示を入力し、コンピュータシステム100からの出力データを受け取ってもよい。ユーザインタフェースは例えば、ユーザI/Oデバイス116を介して、表示装置に表示されたり、スピーカによって再生されたり、プリンタを介して印刷されたりしてもよい。
【0024】
ストレージインタフェース113は、1つ又は複数のディスクドライブや直接アクセスストレージ装置117(通常は磁気ディスクドライブストレージ装置であるが、単一のディスクドライブとして見えるように構成されたディスクドライブのアレイ又は他のストレージ装置であってもよい)の取り付けが可能である。ある実施形態では、ストレージ装置117は、任意の二次記憶装置として実装されてもよい。メモリ104の内容は、ストレージ装置117に記憶され、必要に応じてストレージ装置117から読み出されてもよい。I/Oデバイスインタフェース114は、プリンタ、ファックスマシン等の他のI/Oデバイスに対するインタフェースを提供してもよい。ネットワークインタフェース115は、コンピュータシステム100と他のデバイスが相互的に通信できるように、通信経路を提供してもよい。この通信経路は、例えば、ネットワーク130であってもよい。
【0025】
ある実施形態では、コンピュータシステム100は、マルチユーザメインフレームコンピュータシステム、シングルユーザシステム、又はサーバコンピュータ等の、直接的ユーザインタフェースを有しない、他のコンピュータシステム(クライアント)からの要求を受信するデバイスであってもよい。他の実施形態では、コンピュータシステム100は、クラウド上に提供される仮想的なコンピュータ資源により実現されるものであってもよい。他の実施形態では、コンピュータシステム100は、デスクトップコンピュータ、携帯型コンピュータ、ノートパソコン、タブレットコンピュータ、ポケットコンピュータ、電話、スマートフォン、又は任意の他の適切な電子機器であってもよい。
【0026】
次に、図2を参照して、本開示の実施形態に係る因果推論システム200の構成について説明する。
【0027】
図2は、本開示の実施形態に係る因果推論システム200の構成の一例を示す図である。図2に示すように、因果推論システム200は、プロンプト作成部210、大規模言語モデル220、通信ネットワーク230、初期因果過程生成部240、通信ネットワーク250、からなる。
【0028】
プロンプト作成部210は、指定受付部211、指示テキスト生成部212、例題テキスト生成部213、質問テキスト生成部214、プロンプト生成部215、プロンプト送信部216、提示部217、からなる。
【0029】
プロンプト作成部210と大規模言語モデル220は、通信ネットワーク230を介して互いに接続されている。大規模言語モデル220としては、例えば、GPT(登録商標)2,GPT3,GPT3.5,GPT4,BERT,PaLMを用いることができる。
【0030】
初期因果過程生成部240と大規模言語モデル220は、通信ネットワーク250を介して互いに接続されている。
【0031】
通信ネットワーク230および通信ネットワーク250は、例えばローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、衛星ネットワーク、ケーブルネットワーク、WiFiネットワーク、またはそれらの任意の組み合わせを含むものであってもよい。
【0032】
初期因果過程生成部240は、「事象」から始まり1つ以上の「過程」を経て「結果」に至る因果関係の流れを表す「因果過程」を生成する。例えば、初期因果過程生成部240は、「事象」と「結果」とを与えられて、その「事象」から「結果」までの間に存在する「過程」を推定し、「因果過程」を完成させるものであってもよい。初期因果過程生成部240は、網羅性を拡充する前の因果過程を生成する機能部である。初期因果過程生成部240は、一例として、1つの事象から1つ以上の過程を経て1つの結果に至る一列の因果過程の流れを1つ以上生成する。因果過程は、例えば、事象、過程、結果の間の因果関係の存在およびその方向を「→」(矢印)等の記号で連結した形式で表現することができる。初期因果過程生成部240は、一例として、予め生成された大規模言語モデルに対して事象と結果とを含むプロンプトを入力し、事象、過程、および結果を含む因果過程を示すテキストを出力させるものであってもよい。事象、過程、および結果を含む因果過程を示すテキストを以下「因果過程テキスト」という場合がある。このときに大規模言語モデルに入力されるプロンプトと、大規模言語モデルから出力された因果過程テキストとが、図7に例示されている。図7のプロンプトにおいて、大規模言語モデルに因果過程を生成させるための質問がQ2であり、大規模言語モデルにより生成された因果過程の示す因果過程テキストがA2である。なお、初期因果過程生成部240は、GUI等によりユーザに促して、事象、過程、および結果を含む因果過程テキスト、あるいはプロンプトに相当するテキストと因果過程テキストとの対を入力させるものであってもよい。
【0033】
指定受付部211は、初期因果過程生成部240によって生成された因果過程テキストの中から、ユーザによる他候補生成箇所の指定を受け付ける機能部である。他候補生成箇所とは、因果過程に含まれる一部の過程を他の過程に置き換えた、他の可能な因果過程を生成したい場合に、他の過程に置き換える過程としてユーザにより指定された箇所のことである。例えば、因果過程テキストにおいて「→」の記号で連結された事象、過程、および結果のそれぞれにIDを振り、ユーザが他候補生成箇所として指定した過程のIDを保存しておくといった実装をしてもよい。過程の指定は、画面上でマウスのクリック入力等を受け付けてもよい。
【0034】
指示テキスト生成部212は、与えられた因果過程に含まれる過程のうち少なくとも1つである他候補生成箇所を、1つ又は複数の他候補に置き換えるように大規模言語モデルに指示する指示テキストを生成する。指示テキスト生成部212は、因果過程テキストにおける上記指定受付部211によって受け付けた他候補生成箇所を、例えば「?」など任意の記号で置き換えた、未完成の因果過程のテキストを生成する機能部である。「?」(疑問符)は、1つ又は複数の他候補を入れるための空白を表す記号の例である。上記のIDを振る実装では、ユーザが指定した過程のIDに対応する過程部分を削除し、同じ場所に「?」といった記号を上書きすることで生成することができる。大規模言語モデルに入力されるプロンプトと、大規模言語モデルから出力された因果過程テキストとが図8に例示されている。図8のプロンプトにおける「CP’s trainig facilities」から始まる最終行の部分が、指示テキスト生成部212により生成される指示テキストの一例である。指示テキストには、因果過程およびその因果過程における他候補生成箇所が示されている。
【0035】
例題テキスト生成部213は、大規模言語モデルに与えるプロンプトの中の、例題部分を作成する機能部である。例題の役割は、大規模言語モデルが生成する因果過程テキストの記述フォーマットの指定である。つまり、例題は、大規模言語モデルの出力を意図するフォーマットに導くためにプロンプトに挿入されている。図8の例ではプロンプトで例示するQ1とA1が例題テキスト生成部213によって生成された例題の例である。例えば図8のプロンプトで例示されているように?の箇所を埋め、かつ可能な複数の過程は1)、2)、3)といったフォーマットで列挙することを指定してもよい。例題テキスト生成部213は、例えば、事前にユーザまたは本システム提供者が作成した例題をテキスト形式でメモリに保持しておき、例題を作成するタイミングでそのテキストを読み込んで利用することにしても良い。その場合、ユーザ等は大規模言語モデルを利用して例題を作成してもよい。
【0036】
質問テキスト生成部214は、事象と結果を結びつける因果過程を問う質問文を生成する機能部である。質問テキスト生成部214は、事象が記述されたテキストと、結果が記載されたテキストを受け取り、事前に作成された因果関係を問う質問文のひな型に代入する。例えば、「{事象}の結果、{結果}が生じた。その因果関係が記載された以下の文章の?の部分に当てはまる出来事を複数挙げよ」といった事前に作成された質問文のひな型に対し、入力された事象のテキストを{事象}の箇所に、結果のテキストを{結果}の箇所に代入することによって作成できる。図8の例ではプロンプトのQ2の中で、最終文「CP’s training facilities」から始まる文より前の文章すべてが質問テキスト生成部214によって生成された質問文の例である。
【0037】
プロンプト生成部215は、指示テキスト生成部212によって生成された「?」付きの因果過程テキストと、例題テキスト生成部213によって生成された例題テキストと、質問テキスト生成部214によって生成された質問テキストを連結し、プロンプトと呼ばれるテキストを生成する機能部である。連結する順番は、例題テキスト、質問テキスト、「?」付きの因果過程テキストの順が好適であると思われるが、この順には限定されない。図8のプロンプトは、プロンプト生成部215によって生成されたプロンプトの例である。
【0038】
プロンプト送信部216は、プロンプト生成部215によって生成されたプロンプトを、大規模言語モデルに送信する機能部である。大規模言語モデルは通常、プロンプト作成部210とは異なるサーバーに格納されているが、同じサーバーに格納されていてもよい。
【0039】
提示部217は、プロンプト送信部216によって送信されたプロンプトによって大規模言語モデルから生成されたテキストを、ユーザに提示する機能部である。ユーザに提示後、因果過程の網羅性が十分でないとユーザが判断すれば、指定受付部211によって他候補生成箇所の更なる指定を受け付け、因果過程の生成を繰り返してもよい。
【0040】
以上説明したような構成を有する因果推論システム200によれば、事象と結果の間の可能な因果関係をユーザを巻き込みながら再帰的に生成することで網羅的にリストアップできる手段を提供することができる。
【0041】
次に、図3を参照して、本開示の実施形態に係る因果推論方法について説明する。
【0042】
図3は、本開示の実施形態1に係る因果推論方法300の流れを示すフローチャートである。図3に示す因果推論方法300は、事象と結果の間の可能な因果関係をユーザを巻き込みながら再帰的に生成することで網羅性を高める方法であり、図2に示す因果推論システム200の各装置及び機能部によって実施される。
【0043】
まず、ステップS305では、初期因果過程生成部240は、事象と結果の間の因果過程を「→」などの記号で記述したテキストをユーザの入力または大規模言語モデル等を用いて生成する。
【0044】
次に、ステップS310では、提示部217は、ステップS305で生成されたテキストをユーザに提示し、生成された過程が十分な網羅性があるか、ユーザの評価を受け付ける。もし、十分な網羅性があるとされれば、その時点の生成された因果過程を生成物として提示し、システムの動作を終了する。もし、十分な網羅性が無いとされれば、ステップS315へ進む。
【0045】
次に、ステップS315では、指定受付部211は、ユーザによる他候補生成箇所の指定を受け取る。
【0046】
次に、ステップS320では、指示テキスト生成部212は、他候補生成箇所を他候補に置き換えるように指示する指示テキストを生成する。
【0047】
次に、ステップS325では、例題テキスト生成部213は、大規模言語モデルに対して因果過程テキストの記述フォーマットを指定するための例題テキストを生成する。
【0048】
次に、ステップS330では、質問テキスト生成部214は、事象と結果を結びつける因果過程を問う質問テキストを生成する。
【0049】
次に、ステップS335では、プロンプト生成部215は、前述の例題テキスト生成部213が生成した例題テキストと、前述の質問テキスト生成部214が生成した質問テキストと、前述の指示テキスト生成部212が生成した他候補生成箇所指定テキストを連結し、プロンプトとなるテキストを生成する。
【0050】
次に、ステップS340では、プロンプト送信部216はステップS335で生成されたプロンプトを大規模言語モデルに入力する。
【0051】
次に、ステップS310に戻り、提示部217は大規模言語モデルの出力をユーザに提示し、生成された過程が十分な網羅性があるか、ユーザの評価を受け付ける。もし、十分な網羅性があるとされれば、その時点の生成された因果過程を生成物として提示し、システムの一連の動作を終了する。もし、十分な網羅性が無いとされれば、ステップS315へ進み、上記ステップを、ユーザが十分な網羅性があると評価するまで繰り返す。
【0052】
以上説明した因果推論方法300によれば、事象と結果の間の可能な因果関係をユーザを巻き込みながら再帰的に生成することで網羅的にリストアップできる。
【0053】
次に、図4図6を参照して、本開示の実施形態に係る因果過程の網羅性向上の様子について説明する。
【0054】
図4図6は、本開示の実施形態に係る因果過程の網羅性向上の様子を示す図である。図4には、図3のステップS305において、大規模言語モデルまたはユーザ入力により生成された初期の基準となる因果過程が示されている。各過程は「A」や「B」といった大文字のアルファベットで表されている。ここでは、Aは事象を、Dは結果を表している。その他のアルファベットはその間の過程である。事象、過程および結果の間の因果関係が「→」で表されている。図4の例のように、初期の因果過程は複数であってもよい。
【0055】
図5には、図4の状態から、図3のステップS315からS340の処理によって、他候補生成箇所に指定された過程「C」を、他候補「C1、C2」で置き換えた様子が示されている。この模式図では他候補は2つだが、他候補の個数は特に限定されない。また、他候補生成箇所は任意であり、過程「C」に限定されない。
【0056】
図6には、図5の状態から、再度、図3のステップS315からS340の処理を経た後の状態が示されている。図6の例では、過程「C」に対して他候補「C1、C2」が生成された後、「C1」と「C2」のそれぞれを経由する因果過程に対して、更に過程「B」の網羅性を高める処理が行われている。因果過程「A→B→C1→D」の過程「B」に対して、他候補「B11,B12,B13」が生成されている。因果過程「A→B→C2→D」の過程「B」に対して、他候補「B21,B22,B23」が生成されている。
【0057】
このように、図3のS310でユーザから十分な網羅性が得られたと判断されるまで、図3のS315からS340の処理を繰り返すことができる。
【0058】
以上、本発明の実施の形態について説明したが、本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【0059】
また、以上、本発明の実施の形態には以下に示す事項が含まれている。ただし、本実施の形態に含まれる事項が以下に示すものだけに限定されることはない。
【0060】
(事項1)
事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成するプロンプト生成部と、前記プロンプトを前記言語モデルに送信するプロンプト送信部と、
を備える因果推論装置。これによれば、因果過程に含まれる過程を他候補に置き換えることにより、事象と結果の間の過程を網羅性高く生成することが可能となる。
【0061】
(事項2)
事項1に記載の因果推論装置において、前記因果過程および該因果過程における前記他候補生成箇所を示す指示テキストを生成する指示テキスト生成部と、前記因果過程における前記他候補生成箇所に置き換え可能な他候補を前記言語モデルに質問するための質問テキストを生成する質問テキスト生成部と、を更に備え、前記プロンプト生成部は、前記質問テキストと前記指示テキストとを含むように前記プロンプトを生成する。これによれば、質問テキストと指示テキストを含むプロンプトにより他候補を良好に生成することが可能となる。
【0062】
(事項3)
事項2に記載の因果推論装置において、前記言語モデルへ入力する入力テキスト例と所望の出力フォーマットの出力テキスト例とを対にした例題テキストを生成する例題テキスト生成部を更に備え、前記プロンプト生成部は、前記質問テキストと前記指示テキストと前記例題テキストとを連結して前記プロンプトを生成する。これによれば、所望の出力フォーマットの出力を例示した例題を言語モデルに提示することにより、言語モデルの出力テキストを所望の出力フォーマットに導くことが可能となる。
【0063】
(事項4)
事項3に記載の因果推論装置において、前記プロンプト生成部は、前記例題テキスト、前記質問テキスト、前記指示テキストをその順序で連結して前記プロンプトを生成する。これによれば、言語モデルに、まず例題を与え、次に質問を問いかけ、そののち、問いかけの対象とする因果関係および他候補生成箇所を提示することにより、因果過程における他候補生成の目的に沿って言語モデルの出力を正しく導くことが可能となる。
【0064】
(事項5)
事項2に記載の因果推論装置において、前記言語モデルから出力された因果過程のテキストをユーザに提示する提示部と、提示した因果過程における他候補生成箇所の指定を前記ユーザから受け付ける指定受付部と、を更に備え、前記指示テキスト生成部は、前記他候補生成箇所の指定に従って、前記因果過程から前記指示テキストを生成する。これによれば、ユーザに因果過程を提示して他候補生成箇所の指定を受け付けるので、ユーザは容易に他候補生成箇所を指定することができる。
【0065】
(事項6)
事項5に記載の因果推論装置において、前記指定受付部は、前記他候補生成箇所に指定された過程の識別情報を記録し、前記指示テキスト生成部は、前記識別情報を参照して前記他候補生成箇所を特定する。これによれば、因果過程に含まれる過程を識別情報により識別することで、他候補生成箇所の特定が容易となる。
【0066】
(事項7)
事項3に記載の因果推論装置において、事象、過程、結果という単位でテキストが区切られ、前記事象、前記過程、および前記結果の間に存在する因果関係およびその方向が第1記号により表現された形式で因果過程を生成する因果過程生成部を更に備え、前記指示テキスト生成部は、前記因果過程における前記第1記号で区切られた1つ以上の過程のうち他候補生成箇所とする過程を第2記号に置き換えることにより前記指示テキストを生成し、前記質問テキスト生成部は、前記指示テキストにおける前記第2記号の箇所を他候補に置き換えさせるための質問テキストを生成する。これによれば、因果過程を構成する因果関係と因果過程における他候補生成箇所を記号によって表現するうことにより、理解が容易なプロンプトを生成することができる。
【0067】
(事項8)
事項7に記載の因果推論装置において、前記例題テキスト生成部は、因果関係を前記第1記号で表現した因果過程における他候補生成箇所を前記第2記号で置き換えた前記入力テキスト例と、前記因果過程における前記他候補生成箇所を置き換え可能な複数の過程を前記出力フォーマットで列挙した前記出力テキスト例とを対にした例題テキストを生成する。これによれば、網羅性を向上させる対象とする因果過程と同様に例だ藍も記号を用いて表現することにより、例題を含めて理解が容易なプロンプトを生成することができる。
【0068】
(事項9)
事項7に記載の因果推論装置において、前記第1記号が矢印であり、前記第2記号が疑問符である。これによれば、矢印および疑問符によりユーザおよび言語モデルにて直感的に理解できるプロンプトの表現が可能となる。
【0069】
(事項10)
事項1に記載の因果推論装置において、網羅的な因果過程を生成する対象とする事象および結果の内容は、予めシステム内部に保持されているか、または、ユーザの入力から受け付けられる。これによれば、網羅的な因果過程を生成する対象を事象と結果によって容易に保持あるいは受け付けることができる。
【0070】
(事項11)
事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成し、前記プロンプトを前記言語モデルに送信する、ことをコンピュータが実行する。
【0071】
(事項12)
因果推論プログラムが、事象から1つ以上の過程を経て結果に至る因果関係の流れを表す因果過程における、過程のうち網羅性を高めるべき箇所を他候補生成箇所とし、前記他候補生成箇所に置き換え可能な他候補を言語モデルに生成させるためのプロンプトを生成し、前記プロンプトを前記言語モデルに送信する、ことをコンピュータに実行させる。
【符号の説明】
【0072】
210:プロンプト作成部、211:指定受付部、212:指示テキスト生成部、213:例題テキスト生成部、214:質問テキスト生成部、215:プロンプト生成部、216:プロンプト送信部、217:提示部、220:大規模言語モデル、240:初期因果過程生成部

図1
図2
図3
図4
図5
図6
図7
図8