IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 長瀬産業株式会社の特許一覧

特許7458543情報処理装置、情報処理方法、プログラム、及び記録媒体
<>
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図1
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図2
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図3
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図4
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図5
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図6
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図7
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図8
  • 特許-情報処理装置、情報処理方法、プログラム、及び記録媒体 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-03-21
(45)【発行日】2024-03-29
(54)【発明の名称】情報処理装置、情報処理方法、プログラム、及び記録媒体
(51)【国際特許分類】
   G06F 40/279 20200101AFI20240322BHJP
【FI】
G06F40/279
【請求項の数】 14
(21)【出願番号】P 2023130352
(22)【出願日】2023-08-09
【審査請求日】2023-08-09
【早期審査対象出願】
(73)【特許権者】
【識別番号】000214272
【氏名又は名称】長瀬産業株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】伊藤 史朗
【審査官】原 秀人
(56)【参考文献】
【文献】国際公開第2020/039871(WO,A1)
【文献】特開2022-129172(JP,A)
【文献】清水 理史,NASの文書をChatGPTのコンテキストに! QNAPの全文検索エンジン「Qsirch」を活用,INTERNET Watch [online],2023年06月12日,[令和5年10月27日検索], インターネット <URL : https://internet.watch.impress.co.jp/docs/column/shimizu/1505646.html>
(58)【調査した分野】(Int.Cl.,DB名)
G06F16/00-16/958
G06F 40/20-40/58
(57)【特許請求の範囲】
【請求項1】
クエリを取得する第1の取得部と、
前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出部と、
前記1又は複数の対象チャンクの要約を生成するための指示情報であって、前記1又は複数の適合チャンクを含む指示情報を生成する第1の生成部と、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得部と、
複数のチャンクから前記対象チャンクを抽出する第2の抽出部と
を備え、
前記第2の抽出部は、
複数のチャンクのうち、前記クエリに含まれる1又は複数のキーワード、又は、当該1又は複数のキーワードの同義語又は類義語を含む1又は複数のチャンクを前記1又は複数の対象チャンクとして取得する
情報処理装置。
【請求項2】
前記指示情報には、前記要約に、前記適合チャンクに対応する内容を含める旨の指示が含まれている
請求項1に記載の情報処理装置。
【請求項3】
前記出力情報を参照して回答情報を生成する第2の生成部
を更に備えている
請求項2に記載の情報処理装置。
【請求項4】
前記第2の生成部は、
前記回答情報を含む表示用データを生成する回答情報表示用データ生成部を備えている
請求項3に記載の情報処理装置。
【請求項5】
前記第2の抽出部による処理には、
前記クエリに含まれる1又は複数のキーワード、又は、当該1又は複数のキーワードの同義語又は類義語を含む1又は複数のチャンクに対して拡大処理を適用することによって前記1又は複数の対象チャンクを取得する処理が含まれる
請求項1に記載の情報処理装置。
【請求項6】
前記第1の生成部は、
前記指示情報の少なくとも一部を含む表示用データを生成する指示情報表示用データ生成部を備えている
請求項1から5の何れか1項に記載の情報処理装置。
【請求項7】
前記第1の生成部は、
前記1又は複数の対象チャンクの第1の部分と、前記クエリから得られる指示文とを含む第1の指示情報と、
前記1又は複数の対象チャンクの第2の部分と、前記クエリから得られる指示文とを含む第2の指示情報と
を生成し、
前記第2の取得部は、
前記第1の指示情報が入力された前記言語モデルが出力する第1の出力情報と、
前記第2の指示情報が入力された前記言語モデルが出力する第2の出力情報と
を取得し、
前記第2の生成部は、
前記第1の出力情報の少なくとも一部と前記第2の出力情報の少なくとも一部とを統合することによって前記回答情報を生成する
請求項3又は4に記載の情報処理装置。
【請求項8】
前記クエリには、
物性名、物質名、組成名、物性値、単位、実験条件、及び実験装置の少なくとも何れかが含まれており、
前記出力情報には、
文献情報と、物性名、物質名、組成名、物性値、単位、実験条件、及び実験装置の少なくとも何れとが含まれている
請求項1から5の何れか1項に記載の情報処理装置。
【請求項9】
情報処理装置であって、
クエリを取得する第1の取得部と、
前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出部と、
前記1又は複数の対象チャンクの要約を生成するための指示情報であって、前記1又は複数の適合チャンクを含む指示情報を生成する第1の生成部と、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得部と
を備え、
前記指示情報には、前記要約に、前記適合チャンクに対応する内容を含める旨の指示が含まれており、
当該情報処理装置は、
前記出力情報を参照して回答情報を生成する第2の生成部
を更に備え、
前記第2の生成部は、
前記回答情報を含む表示用データを生成する回答情報表示用データ生成部を備え、
当該情報処理装置は、
1又は複数のチャンクから前記対象チャンクを抽出する第2の抽出部を更に備え、
前記第2の抽出部は、
前記複数のチャンクのうち、前記クエリに整合する1又は複数のチャンクを取得し、
前記クエリに整合する1又は複数のチャンクに対して拡大処理を適用することによって前記1又は複数の対象チャンクを取得する
情報処理装置。
【請求項10】
情報処理装置が実行する情報処理方法であって、
クエリを取得する第1の取得ステップと、
前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出ステップと、
前記1又は複数の対象チャンクの要約を生成するための指示情報であって、1又は複数の適合チャンクを含む指示情報を生成する第1の生成ステップと、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得ステップと
を含み、当該情報処理方法は、前記第1の抽出ステップに先立ち、
複数のチャンクから前記対象チャンクを抽出する第2の抽出ステップ
を含み、
前記第2の抽出ステップは、
複数のチャンクのうち、前記クエリに含まれる1又は複数のキーワード、又は、当該1又は複数のキーワードの同義語又は類義語を含む1又は複数のチャンクを前記1又は複数の対象チャンクとして取得する
情報処理方法。
【請求項11】
情報処理装置が実行する情報処理方法であって、
クエリを取得する第1の取得ステップと、
前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出ステップと、
前記1又は複数の対象チャンクの要約を生成するための指示情報であって、1又は複数の適合チャンクを含む指示情報を生成する第1の生成ステップと、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得ステップと
を含み、
前記指示情報には、前記要約に、前記適合チャンクに対応する内容を含める旨の指示が含まれており、
当該情報処理方法は、
前記出力情報を参照して回答情報を生成する第2の生成ステップ
を更に含み、
前記第2の生成ステップは、
前記回答情報を含む表示用データを生成する回答情報表示用データ生成ステップを含み、
当該情報処理方法は、前記第1の抽出ステップに先立ち、
1又は複数のチャンクから前記対象チャンクを抽出する第2の抽出ステップを更に含み、
前記第2の抽出ステップは、
前記複数のチャンクのうち、前記クエリに整合する1又は複数のチャンクを取得し、
前記クエリに整合する1又は複数のチャンクに対して拡大処理を適用することによって前記1又は複数の対象チャンクを取得する
情報処理方法。
【請求項12】
請求項1に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、上記第1の取得部、上記第1の抽出部、上記第1の生成部、上記第2の取得部、及び上記第2の抽出部としてコンピュータを機能させるためのプログラム。
【請求項13】
請求項9に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、上記第1の取得部、上記第1の抽出部、上記第1の生成部、上記第2の取得部、上記第2の抽出部、及び上記第2の生成部としてコンピュータを機能させるためのプログラム。
【請求項14】
請求項12又は13に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、言語モデルを用いて情報を生成する技術に関する。
【背景技術】
【0002】
学習済の言語モデルを用いて文書を要約する技術が知られている。例えば、特許文献1には、テキストを話題単位でブロックに区切ったブロック化テキストを生成し、当該ブロック化テキストにおける前記ブロックごとに前記テキストの内容を要約して要約化テキストを出力するテキスト要約方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2023-34235号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1のような従来技術では、ユーザにとって有用な情報が要約に含まれるとは限らないという問題があった。
【0005】
本発明の一態様は、ユーザにとって有用な情報を含む要約を生成することのできる技術を提供することにある。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本発明の一態様に係る情報処理装置は、クエリを取得する第1の取得部と、前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出部と、前記1又は複数の対象チャンクの要約を生成するための指示情報であって、前記1又は複数の適合チャンクを含む指示情報を生成する第1の生成部と、前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得部とを備えている。
【0007】
また、上記の課題を解決するために、本発明の一態様に係る情報処理方法は、情報処理装置が実行する情報処理方法であって、クエリを取得する第1の取得ステップと、前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出ステップと、前記1又は複数の対象チャンクの要約を生成するための指示情報であって、1又は複数の適合チャンクを含む指示情報を生成する第1の生成ステップと、前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得ステップとを含んでいる。
【0008】
本発明の各態様に係る情報処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを前記情報処理装置が備える各部(ソフトウェア要素)として動作させることにより前記情報処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【発明の効果】
【0009】
本発明の一態様によれば、ユーザにとって有用な情報を含む要約を生成することができる。
【図面の簡単な説明】
【0010】
図1】本発明の実施形態1に係る情報処理システムの構成を示すブロック図である。
図2】本発明の実施形態1に係る情報処理装置による処理の流れを示すフロー図である。
図3】本発明の実施形態1に係る情報処理装置による処理を説明するための図である。
図4】本発明の実施形態1に係る情報処理装置が表示する表示情報の例を示す図である。
図5】本発明の実施形態1に係る情報処理装置による処理を説明するための図である。
図6】本発明の実施形態1に係る情報処理装置が生成する指示情報の例を示す図である。
図7】本発明の実施形態1に係る情報処理装置が生成する回答情報の例を示す図である。
図8】本発明の実施形態2に係る情報処理システムの構成を示すブロック図である。
図9】本発明の各実施形態に係る情報処理システムのハードウェア構成を示す図である。
【発明を実施するための形態】
【0011】
〔実施形態1〕
<情報処理システム1の概要>
詳細については後述するが、本発明の一実施形態に係る情報処理システム1は、情報処理装置100と、サーバ200とを含んでいる。ここで、サーバ200は、情報処理装置100から提供される入力データ(入力情報、指示情報)であるプロンプトPRから出力データ(出力情報OUT)を生成する言語モデルLMを備えている。
【0012】
一方、情報処理装置100は、概略的に言えば、
・クエリを取得し、
・前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出し、
・前記1又は複数の対象チャンクの要約を生成するための指示情報であって、前記1又は複数の適合チャンクを含む指示情報を生成し、
・前記指示情報が入力された言語モデルが出力する出力情報を取得する
という構成を有している。
【0013】
情報処理装置100は、上述のように、クエリを取得し、前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出し、前記1又は複数の対象チャンクの要約を生成するための指示情報であって、1又は複数の適合チャンクを含む指示情報を生成し、前記指示情報が入力された言語モデルが出力する出力情報を取得する。したがって、情報処理装置100によれば、ユーザにとって有用な情報を含む要約を生成することができる。
【0014】
<情報処理システム1の構成>
以下では、図面を参照しつつ、本発明の一実施形態に係る情報処理システム1について、詳細に説明する。図1は、情報処理システム1の構成を示すブロック図である。図1に示すように、情報処理システム1は、情報処理装置100とサーバ200とを備えている。
【0015】
(サーバ200の構成)
まず、情報処理システム1が備えるサーバ200の構成について説明する。サーバ200は、図1に示すように、制御部240、記憶部220、及び通信部230を備えている。
【0016】
(通信部230)
通信部230は、サーバ200の外部の装置と通信を行う。一例として通信部230は、情報処理システム1が備える情報処理装置100と通信を行う。通信部230は、制御部240から供給されたデータを情報処理装置100に送信したり、情報処理装置100から受信したデータを制御部240に供給したりする。なお、通信部230が情報処理装置100から受信するデータには、当該情報処理装置100によって生成された指示情報であるプロンプトPRが含まれる。また、通信部230が情報処理装置100に提供するデータには、言語モデルLMが当該プロンプトPRを参照して生成した出力情報OUTが含まれ得る。
【0017】
(記憶部220)
記憶部220には、言語モデルLMが格納されている。より具体的には、記憶部220には、当該言語モデルLMを規定する複数のパラメータが格納されている。これらのパラメータは、一例として、機械学習によって予め学習(更新)されたパラメータであるが、これは本実施形態を限定するものではない。また、言語モデルLMは、様々な分野における文書を教師データとして機械学習されたモデルであるが、言語モデルLMの詳細は本実施形態を限定するものではない。
【0018】
(制御部240)
制御部240は、上記言語モデルLMを実行することによって当該言語モデルLMによる出力結果を取得する。一例として、制御部240は、情報処理装置100から受信したプロンプトPRを、当該言語モデルLMに入力し、当該言語モデルLMが生成した出力情報OUTを取得する。また、当該出力情報OUTを、通信部230を介して情報処理装置100に提供する。
【0019】
なお、本実施形態では、サーバ200が備える各構成を、情報処理装置100とは別体の構成として例示したが、これは本実施形態を限定するものではない。例えば、サーバ200が備える制御部240又は当該制御部240における言語モデル実行部としての機能を、情報処理装置100の制御部が備える構成としてもよい。同様に、サーバ200が備える記憶部220に格納された言語モデルLMを、情報処理装置100の記憶部が格納し、当該情報処理装置100自身によって言語モデルLMを実行可能な構成としてもよい。
【0020】
(情報処理装置100の構成)
続いて、情報処理システム1が備える情報処理装置100の構成について説明する。図1に示すように、情報処理装置100は、制御部110、記憶部120、通信部130、及び入出力部140を備えている。
【0021】
なお、ここでの説明では、情報処理装置100が上述の各部を備える構成としているが、これは本実施形態を限定するものではない。一例として、通信可能に接続された複数の装置において、上記各部が、分散的に配置される構成としてもよい。
【0022】
(通信部130)
通信部130は、情報処理装置100の外部の装置と通信を行う。一例として通信部130は、サーバ200と通信を行う。通信部130は、制御部110から供給されたデータをサーバ200に送信したり、サーバ200から受信したデータを制御部110に供給したりする。なお、通信部130がサーバ200に送信するデータには、制御部110によって生成されたプロンプトPRが含まれ得る。また、通信部130がサーバ200から受信するデータには、当該プロンプトPRを参照することにより、サーバ200の言語モデルLMが生成した出力情報OUTが含まれ得る。
【0023】
(入出力部140)
入出力部140は、キーボード、マウス、表示パネル、タッチパッド、タッチパネル等の入出力装置の少なくとも何れかを備えて構成される。或いは、入出力部140を、キーボード、マウス、表示パネル、タッチパッド、タッチパネル等の入出力機器が接続される入出力インタフェースとして構成してもよい。当該構成の場合、入出力部140は、接続された入力機器から情報処理装置100に対する各種の情報の入力を受け付ける。また、入出力部140は、接続された出力機器に各種の情報を出力する。
【0024】
なお、情報処理装置100において、入出力部140は必須の構成ではない。一例として、情報処理装置100は入出力部140を備えずに、情報処理装置100と通信可能に構成された別の装置が入出力部140を備える構成としてもよい。
【0025】
(記憶部120)
記憶部120には、制御部110が参照する各種のデータ、及び制御部110によって生成された各種のデータが格納される。一例として、記憶部120には、
・文書群DG
・チャンク群CG
・ベクトル群VG
・クエリQR
・指示文IN
・対象チャンクTC
・出力情報OUT
・回答情報RI
が格納されている。ここで、文書群DGは、予め取得された複数の文書から構成される。ここで、文書の種別、言語、取得元、サイズ等は、本実施形態を限定するものではなく、任意の種別、言語、取得元、サイズ等を有する文書を用いることができる。なお、当該文書群DGの一例として、公開された無償の論文、有償の論文、特許明細書、技報、社内文書等を挙げることができる。なお、本実施形態において後述する「同義語」「類義語」との概念には、互いに異なる言語に属する「同義語」「類義語」も含まれる。
【0026】
チャンク群CGは、文書群DGに含まれる1又は複数の文書から抽出された1又は複数のチャンクから構成される。ここで、チャンクとは、文書自体、又は文書に含まれる1又は複数の構成要素のことを指す。チャンクの一例として、文書自体、文書に含まれる文章、段落、文、文節、単語、文字、数字、記号等を挙げることができるが、当該例は本実施形態を限定するものではない。
【0027】
ベクトル群VGは、チャンク群CGに含まれる1又は複数のチャンクの各々についてのベクトル(特徴量空間における特徴ベクトルとも呼ぶ)から構成される。ここで、チャンクから特徴ベクトルへの変換(特徴量空間へのチャンクの埋め込み(embedding))は、所定のアルゴリズムを用いて予め行っておくことができる。
【0028】
なお、本実施形態において、情報処理装置100がベクトル群VGを保持すること、及び当該ベクトル群VGに含まれるベクトルを用いて各種の処理を行うことは必須でない。
【0029】
なお、本実施形態の説明において、制御部110の各部が主として、「チャンク」を参照した処理を行う場合を例に挙げているが、当該例は本実施形態を限定するものではなく、予め文書が1又は複数の文書に分割されていることは本実施形態の処理において本質的な事項ではない。例えば、本実施形態に記載の各処理において、「チャンク」「対象チャンク」「適合チャンク」を、それぞれ、「文書」「対象文書」「適合文書」としても当該処理はそのまま成立し、そのような例もまた本実施形態に含まれる。
【0030】
クエリQRは、ユーザからの問い合わせ、要求、要望等を示すデータであり、一例として、情報処理装置100の入出力部140を介して取得される。クエリQRに含まれるデータは一例としてテキストデータの形式で表現され得るが、これは本実施形態を限定するものではない。
【0031】
また、クエリQRがテキストデータの形式で表現される場合、当該テキストの言語は本実施形態を限定するものではない。また、クエリQRの言語は、上述した文書群DGに含まれる文書と異なる言語であってもよい。また、クエリQRの言語は、上述したチャンク群CGに含まれるチャンクと異なる言語であってもよい。
【0032】
プロンプトPRは、後述する第1の生成部13によって生成される情報であり、一例として、1又は複数の適合チャンクACと、1又は複数の対象チャンクTCとを含んでいる。ここで、適合チャンクACは、後述する第1の抽出部12によって抽出(特定、取得)されたチャンクであって、クエリQRに適合するチャンクのことを指す。一方、対象チャンクTCは、後述する第2の抽出部15によって抽出(特定、取得)されたチャンクである。
【0033】
プロンプトPRは、一例として、指示文INと1又は複数の対象チャンクTCとを含むように構成され、当該指示文INが、上記1又は複数の適合チャンクACを含むよう構成されてもよい。プロンプトPRは、言語モデルLMに入力される指示情報の一例である。プロンプトPRの具体例については後述する。
【0034】
なお、適合チャンクAC、対象チャンクTC及び指示文INは、一例としてテキストデータであり、プロンプトPRもこれらのテキストデータを含んで構成されるが、これは本実施形態を限定するものではない。プロンプトPRは、テキストデータ以外にも、画像データ、グラフデータ、及び表データ等の任意の形式のデータを含む構成としてもよい。
【0035】
出力情報OUTは、プロンプトPRが入力された言語モデルLMが出力する情報であり、一例として、通信部130を介して、後述する第2の取得部14によって取得される。出力情報OUTの具体例については後述する。
【0036】
回答情報RIは、後述する第2の生成部16によって、出力情報OUTを参照して生成される情報である。当該回答情報RIは、一例として、上述したクエリQRに対する回答又は要約を含む情報である。回答情報RIの具体例については後述する。
【0037】
(制御部110)
制御部110は、図1に示すように、第1の取得部11、第1の抽出部12、第1の生成部13、第2の取得部14、第2の抽出部15、及び第2の生成部16を備えている。
【0038】
(第1の取得部11)
第1の取得部11は、クエリQRを取得する。一例として、第1の取得部11は、入出力部140を介したユーザからの入力に応じたクエリQRを取得する。取得したクエリQRは、一例として、記憶部120に格納されると共に、第1
(第1の抽出部12)
第1の抽出部12は、1又は複数の対象チャンクTCから、前記クエリQRに適合するチャンクである1又は複数の適合チャンクACを抽出する。ここで、上記1又は複数の対象チャンクTCは、一例として、後述する第2の抽出部15によって、チャンク群CGから抽出(取得)されたチャンクである。なお、第1の抽出部12は、チャンク群CGから1又は複数の適合チャンクACを抽出する構成としてもよいし、クエリQR自体を1又は複数のチャンク又は対象チャンクとして捉え、当該クエリQRから1又は複数の適合チャンクACを抽出する構成としてもよい。
【0039】
(第1の生成部13)
第1の生成部13は、1又は複数の対象チャンクTCの要約を生成するためのプロンプトPR(指示情報)であって、前記1又は複数の適合チャンクACを含むプロンプトPR(指示情報)を生成する。
【0040】
ここで、当該プロンプトPR(指示情報)には、
・「前記要約に、前記適合チャンクACに対応する内容を含める」旨の指示
が含まれていることが好ましい。当該構成によれば、後述する言語モデルLMが生成する要約に前記適合チャンクACに対応する内容が好適に含まれることになるので、ユーザにとって有用な情報を要約に含めることができる。生成されたプロンプトPRは、一例として通信部130を介して、サーバ200の言語モデルLMに提供される。
【0041】
第1の生成部13は、一例として、図1に示すように、指示情報表示用データ生成部131を備えている。ただし、第1の生成部13に関する当該構造は、あくまで一例であり、第1の生成部13は、当該構成要素による処理を実行可能に構成されていれば、任意の構成であってよい。
【0042】
一方、第1の生成部13が備える指示情報表示用データ生成部131は、上記プロンプトPR(指示情報)の少なくとも一部を含む表示用データを生成する。指示情報表示用データ生成部131が生成した表示用データは、一例として、入出力部140が備える表示パネル又はタッチパネルを介してユーザに視覚的に提示される。
【0043】
また、第1の生成部13は、指示情報表示用データ生成部131が生成した表示用データを視認したユーザによる修正指示を取得し、当該取得した修正指示に応じて、上記プロンプトPRを修正する構成としてもよい。当該構成の場合、第1の生成部13は、修正後のプロンプトPRを、サーバ200の言語モデルLMに提供する構成としてもよい。
【0044】
(第2の取得部14)
第2の取得部14は、上記プロンプトPR又は上記修正後のプロンプトPRが入力された言語モデルLMが出力する出力情報OUTを取得する。取得された出力情報OUTは、一例として、記憶部120に格納され、後述する第2の生成部16によって参照される。出力情報OUTの具体例については後述する。
【0045】
(第2の生成部16)
第2の生成部16は、言語モデルLMによって出力された前記出力情報OUTを参照して回答情報RIを生成する。回答情報RIの具体例については後述する。また、第2の生成部16は、一例として、図1に示すように、回答情報表示用データ生成部161を備えている。ただし、第2の生成部16に関する当該構造は、あくまで一例であり、第2の生成部16は、当該構成要素による処理を実行可能に構成されていれば、任意の構成であってよい。第2の生成部16が備える回答情報表示用データ生成部161は、前記回答情報RIを含む表示用データを生成する。回答情報RIの表示例については後述する。
【0046】
(第2の抽出部15)
第2の抽出部15は、チャンク群CGに含まれる1又は複数のチャンクから1又は複数の対象チャンクTCを抽出する。抽出された1又は複数の対象チャンクTCは、一例として、上述した第1の抽出部12及び第1の生成部13によって参照される。
【0047】
なお、第2の抽出部15は、チャンク群CGに含まれる1又は複数のチャンクのうち、前記クエリQRに整合する1又は複数のチャンクを前記1又は複数の対象チャンクTCとして取得する構成としてもよい。
【0048】
ここで、「クエリQRに整合するチャンク」とは、一例として、当該クエリQRに含まれる1又は複数のキーワード、又は、当該1又は複数のキーワードの同義語又は類義語を含むチャンクのことを指す(以下同様)。ただし、当該例は本実施形態を限定するものではない。
【0049】
上記の構成によれば、クエリQRに整合するチャンクを対象チャンクとして取得するので、第2の抽出部15は、チャンクの絞り込みを好適に行うことができる。したがって、チャンクを参照した処理のコストを好適に低減することができる。
【0050】
或いは、第2の抽出部15は、
・チャンク群CGに含まれる1又は複数のチャンクのうち、前記クエリQRに整合する1又は複数のチャンクを取得し、
・前記クエリQRに整合する1又は複数のチャンクに対して拡大処理を適用することによって前記1又は複数の対象チャンクTCを取得する
という構成としてもよい。
【0051】
ここで、「拡大処理」とは、一例として、対象チャンクTCに、
・前記クエリQRに整合する1又は複数のチャンクCK
に加えて、
・当該チャンクCKに対して文脈上前及び後ろの少なくとも何れかに位置するチャンク
を含める処理のことを指す。
【0052】
より具体的な例として、「拡大処理」には、
・前記クエリQRに整合する1又は複数のチャンクCK1と、当該チャンクCK1に対して文脈上前又は後ろに位置するチャンクCK2との類似度を算出し、
・算出した類似度が所定の閾値以上であれば、前記チャンクCK1に加えて、当該チャンクCK2も対象チャンクTCに含める
という処理が含まれ得る。また、「拡大処理」として、これらの処理を複数のチャンクCK1に対して繰り返し行ってもよい。例えば、「拡大処理」として、
・上記チャンクCK2を対象チャンクTCに加えたうえで、上記チャンクCK2に対して文脈上前又は後ろに位置するチャンクCK3と、チャンクCK1又はチャンクCK2との類似度を算出し、
・算出した類似度が所定の閾値以上であれば、当該チャンクCK3も対象チャンクTCに含め、
・更に、当該チャンクCK3と、その前後のチャンクとの類似度に応じて、当該前後のチャンクを対象チャンクに加える
という処理を行ってもよい。ここで、チャンクの類似度を算出処理においてチャンクの各々についての特徴ベクトルの類似度を用いる構成としてもよい。
【0053】
また、他の例として、「拡大処理」には、
・前記クエリQRに整合する1又は複数のチャンクCKに対して文脈上前に位置するN個までのチャンク、及び当該1又は複数のチャンクCKに対して文脈上後に位置するN個までのチャンクを対象チャンクTCに含める構成としてもよい。
【0054】
以上のように、第2の抽出部15が拡大処理を適用することによって、好適な分量の対象チャンクTCを用意することができるので、チャンクを参照して生成されるデータの正確性を向上させることができる。
【0055】
(情報処理装置100による処理の流れ)
続いて、図2を参照して、本実施形態に係る情報処理装置100による処理の流れについて説明する。図2は、情報処理装置100による情報処理方法S100の流れを示すフロー図である。
【0056】
(ステップS101)
ステップS101において、第1の取得部11は、クエリQRを取得する。クエリQRの具体例については、参照する図面を代えて後述するが、一例として、情報処理装置100をマテリアルインフォマティクスの分野に適用した場合、クエリQRには、一例として、物性名、物質名、組成名、物性値、単位、実験条件、及び実験装置の少なくとも何れかが含まれ得る。ただし、これらの条件や項目はあくまで例であり、第1の取得部11は、他の情報をクエリQRとして取得する構成としてもよく、また、情報処理装置100は任意の分野に適用可能である。
【0057】
(ステップS102)
続いて、ステップS102において、第2の抽出部15は、ステップS101において取得されたクエリQRを参照して、チャンク群CGに含まれる複数のチャンクから、1又は複数の対象チャンクTCを抽出する。
【0058】
(ステップS103)
続いて、ステップS103において、第1の抽出部12は、ステップS102において取得された1又は複数の対象チャンクTCから、前記クエリQRに適合するチャンクである1又は複数の適合チャンクACを抽出する。
【0059】
(ステップS104)
続いて、ステップS104において、第1の生成部13は、1又は複数の対象チャンクTCの要約を生成するためのプロンプトPRであって、前記1又は複数の適合チャンクACを含むプロンプトPRを生成する。
【0060】
(ステップS101~S104の各処理に関する具体例1)
ここで、上述のステップS101~S104の各処理に関する具体例1について説明する。図3は、情報処理装置100をマテリアルインフォマティクスの分野に適用した場合の当該具体例1を説明するための図である。
【0061】
図3の上段は、ステップS101において、第1の取得部11が取得するクエリQRの例を示している。図3の上段に示す例では、第1の取得部11は、「1.60×10-6 cm2/s 以下のメタノール透過率をもつ複合膜」という条件文をクエリQRとして取得する。第1の取得部11は、一例として、当該条件文を受け付け可能に構成されているUI(User Interface)画面を介して、クエリQRを取得する。
【0062】
図3の中段は、ステップS102において第2の抽出部15が抽出した対象チャンクTC及びステップS103において第1の抽出部12が抽出した適合チャンクACの例を模式的に示している。
【0063】
図3の下段は、ステップS104において第1の生成部13が生成したプロンプトPRの一例としてのプロンプトPR1を示している。図3の下段に示すように、第1の生成部13は、
・適合チャンクACを含み、当該適合チャンクACを参照した指示文IN1を生成し、
・生成した指示文IN1と、対象チャンクTCとを含むプロンプトPR1を生成している。
【0064】
より具体的には、第1の生成部13は、『適合チャンクACに書かれている「1.60×10-6cm2/s 以下のメタノール透過率をもつ複合膜」の内容を中心に、以下のテキスト(対象チャンクTC)を要約しなさい。』という指示文IN1と、対象チャンクTCとを含むプロンプトPR1を生成している。
【0065】
換言すれば、当該プロンプトPR1(指示情報)には、
・「前記要約に、前記適合チャンクACに対応する内容を含める」旨の指示
が含まれている。当該構成によれば、後述する言語モデルLMが生成する要約に前記適合チャンクACに対応する内容が好適に含まれることになるので、ユーザにとって有用な情報を要約に含めることができる。
【0066】
また、上述のように、本例において第1の生成部13は、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する1又は複数の適合チャンクACを含むプロンプトを生成するので、情報処理装置100によれば、ユーザにとって有用な情報を含む要約を生成することができる。
【0067】
なお、図3の下段に示したプロンプトの例はあくまで一例であり、本実施形態を限定するものではない。第1の生成部13が生成するプロンプトPRは、1又は複数の対象チャンクTCの要約を生成するためのプロンプトPR(指示情報)であって、前記1又は複数の適合チャンクACを含むプロンプトPR(指示情報)であればどのような形式であってもよい。
【0068】
また、言語モデルLMによっては、プロンプトPRにおいてロールの設定が可能な場合がある。そのような場合、第1の生成部13が、当該言語モデルLMの仕様に応じて、プロンプトPRにおいてロールの設定を行ったり、プロンプトPRを複数のプロンプトに分割したうえで各プロンプトにおいてロールの設定を行ったりする構成としてもよい。
【0069】
(ステップS101~S104の各処理に関する具体例2)
続いて、上述のステップS101~S104の各処理に関する具体例2について説明する。図4図6は、情報処理装置100をマテリアルインフォマティクスの分野に適用した場合当該具体例2を説明するための図である。
【0070】
図4は、ステップS101において、制御部110が入出力部140に表示する表示画面の例である表示画面DIS0を示す図である。図4に示す例では、クエリQRとして、ユーザが「常温でのイオン電導度が高い物質」と入力した例が示されている。本例においても第1の取得部11は、当該クエリQRを受け付け可能に構成されているUI(User Interface)画面を介して、クエリQRを取得する。
【0071】
図4における出力文書数DNは、回答情報RIとして出力する文書の数を示しており、ユーザによって変更可能な値である。また、図4に示すように、表示画面DIS0は、当該クエリQRを用いた処理にかかる費用の推定値(費用見込み、費用見積り)を表示する領域(図4におけるCOST1)を含んでいてもよい。また、図4に示すように、表示画面DIS0は、
・対象を指定するための「対象指定」ボタンB1
・検索を開始するための「検索開始」ボタンB2
・費用見積りを算出するための「費用見積り」ボタンB3
の少なくとも一部を含む構成としてもよい。
【0072】
図5は、ステップS102における第2の抽出部15による処理を模式的に示す図である。図5に示す例では、チャンク群CGは、複数の論文に含まれる構成要素をチャンクとして含んでいる。より具体的には、図5に示すチャンク群CGは、論文1~3のそれぞれにおける「実験結果の説明」の記載を、チャンクC1~C3として含んでいる。
【0073】
ステップS102において、第2の抽出部15は、一例として、上述したクエリQRに含まれるキーワードによる絞り込みを行うことによって、チャンクC1を除外する一方で、チャンクC2及びC3を抽出する。本例では、チャンクC1は、クエリQRに含まれるキーワードに該当する文言を含んでいないため、第2の抽出部15によって除外される。一方、チャンクC2及びC3は、クエリQRに含まれるキーワードに該当する文言を含んでいるため第2の抽出部15によって抽出される。このようにして抽出されたチャンクC2及びチャンクC3は、対象チャンクTC2及び対象チャンクTC3として、対象チャンクTCを構成する。
【0074】
また、図5に示すように、ステップS102において、第2の抽出部15は、対象チャンクTC2及び対象チャンクTC3に対して拡大処理を適用してもよい。図5に示す例では、第2の抽出部15は、論文2に関し、チャンクC2に対して文脈上前に位置する「実験装置の説明」の記載、及び文脈上後に位置する「結論」の記載を対象チャンクTCに含めている。また、図5に示す例では、第2の抽出部15は、更に、論文3に関し、チャンクC3に対して文脈上前に位置する「実験装置の説明」の記載、及び文脈上後に位置する「結論」の記載を対象チャンクTCに含めている。図5では、チャンクC2を拡大して得られる拡大後の対象チャンクをEC2又はTC2’と表記し、チャンクC3を拡大して得られる拡大後の対象チャンクをEC3又はTC3’と表記している。ただしこれらの表記法は本実施形態を限定するものではない。
【0075】
なお、ステップS102において第2の抽出部15が実行する「拡大処理」の具体的内容については、すでに詳細な例を上述したためここでは説明を省略する。なお、ステップS102における「拡大処理」は、本実施形態を限定するものではなく、ステップS102における「拡大処理」を含まない処理の流れも本実施形態に含まれる。
【0076】
図6は、本例に係る第1の生成部13がステップS104において生成したプロンプトPRの一例であるPR1を示している。図6に示すプロンプトPR1は、指示情報表示用データ生成部131が生成する表示用データ(表示画面DIS1)の一例でもある。
【0077】
図6に示すように、プロンプトPR1は、指示文INの一例として、
『以下の対象チャンクから、
・「常温でのイオン電導度が高い物質」という内容を含む要約を生成してください。
・その際、要約が「常温でのイオン電導度が高い物質」という内容に整合する記載をより多く含むようにしてください。』
との指示文IN1を含んでいる。当該指示文IN1は、
・「常温でのイオン電導度が高い物質」
というクエリQRを参照して、第1の生成部13が生成した指示文である。また、本例では、当該クエリQRと、当該クエリQRに適合する適合チャンクACとが同一の内容である場合を例示している。このため、当該指示文IN1は、
・「常温でのイオン電導度が高い物質」
という適合チャンクACを含む指示文であると表現することもできる。また、当該プロンプトPR(指示情報)には、
・「前記要約に、前記適合チャンクACに対応する内容を含める」旨の指示
が含まれていると表現することもできる。当該構成によれば、後述する言語モデルLMが生成する要約に前記適合チャンクACに対応する内容が好適に含まれることになるので、ユーザにとって有用な情報を要約に含めることができる。ただし当該例は本実施形態を限定するものではない。
【0078】
また、上記指示文IN1には、上述のように「要約が「常温でのイオン電導度が高い物質」という内容に整合する記載をより多く含むようにしてください」との指示を含んでいる。当該指示は、1又は複数の対象チャンクTCの要約を生成するためのプロンプトPR(指示情報)であって、前記クエリQRに適合する内容をより多く含む要約を生成するためのプロンプトPR(指示情報)に含まれる内容の一例である。
【0079】
なお、指示文IN1には、
・「抽出元のチャンクIDを出力してください。」
のような指示を更に含む構成としてもよい。当該指示を含めることにより、プロンプトPR1を参照して生成された要約が、何れのチャンクから抽出されたものかを制御部110が特定することができる。制御部110は、一例として、当該チャンクIDを、当該対象チャンクの抽出元である文献IDと関連付けて管理しておくことにより、上記要約が何れの文献から抽出されたものであるかを特定することができる。
【0080】
また、図6に示すように、プロンプトPR1は、上記指示文IN1において言及されている対象として、上述の「拡大処理」によって拡大された対象チャンクEC2(TC2’)及び対象チャンクEC3(TC3’)を含んでいる。プロンプトPR1が、対象として、これらの対象チャンクを含んでいるため、当該プロンプトPR1が入力された言語モデルLMは、これらの対象チャンクから、上記指示文IN1に従って、要約を生成することになる。
【0081】
なお、ステップS104において、第1の生成部13が備える指示情報表示用データ生成部131は、プロンプトPR1を表示画面DIS1として入出力部140が備える表示パネル又はタッチパネルを介してユーザに提示してもよい。当該構成によれば、生成されたプロンプトPRを、言語モデルLMに入力する前に、ユーザが容易に確認することができる。
【0082】
また、ステップS104において、第1の生成部13は、当該表示画面DIS1を視認したユーザからの修正指示を受け付け、当該修正指示に基づき、プロンプトPR1を修正してもよい。当該構成によれば、プロンプトPRを、ユーザにとってより好ましいものとすることができる。
【0083】
上述のように、本例において第1の生成部13は、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する1又は複数の適合チャンクACを含むプロンプトを生成する。また、本例において第1の生成部13は、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する内容をより多く含む要約を生成するための指示情報を生成すると表現することもできる。このような処理を行うことによって、情報処理装置100は、ユーザにとって有用な情報を含む要約を生成することができる。
【0084】
なお、図6に示したプロンプトの例はあくまで一例であり、本実施形態を限定するものではない。第1の生成部13が生成するプロンプトPRは、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する1又は複数の適合チャンクACを含むプロンプトあればどのような形式であってもよい。
【0085】
また、言語モデルLMによっては、プロンプトPRにおいてロールの設定が可能な場合がある。そのような場合、第1の生成部13が、当該言語モデルLMの仕様に応じて、プロンプトPRにおいてロールの設定を行ったり、プロンプトPRを複数のプロンプトに分割したうえで各プロンプトにおいてロールの設定を行ったりする構成としてもよい。
【0086】
(ステップS105)
図2に戻り、ステップS105において、第1の生成部13は、ステップS104において生成されたプロンプトPR、またはステップS104において生成されユーザ指示によって修正されたプロンプトPRを、通信部130を介してサーバ200に提供し、当該プロンプトPRを、言語モデルLMに入力する。当該プロンプトが入力された言語モデルLMは、当該プロンプトPRに応じた出力情報OUTを生成する。
【0087】
(ステップS106)
ステップS106において、第2の取得部14は、言語モデルLMが出力した出力情報OUTを取得する。取得された出力情報OUTは、一例として記憶部120に格納されると共に、第2の生成部16によって参照される。
【0088】
(ステップS107)
ステップS107において、第2の生成部16は、ステップS106において取得した出力情報OUTを結果リストに追加する。
【0089】
(ステップS108)
ステップS108において、第2の生成部16は、チャンク群に含まれる複数のチャンク、又は当該複数のチャンクから抽出され、対象チャンクTCの候補として保持されている複数のチャンクのうち、未処理のチャンクがあるか否かを判定する。
【0090】
未処理のチャンクがある場合(ステップS108でYES)、ステップS104に戻り、当該未処理のチャンクから対象チャンクTCを選択し、ステップS104以降の処理を行う。一方で、未処理のチャンクがない場合(ステップS108でNO)、ステップS109に進む。
【0091】
(ステップS109)
ステップS108において、第2の生成部16は、出力情報OUTを参照して、回答情報RIを生成する。一例として、第2の生成部16は、
・結果リストに蓄積された出力情報OUTの少なくとも一部を参照することによって、回答情報RIを生成したり、
・結果リストに蓄積された出力情報OUTを統合し、統合後の回答情報を参照することによって、回答情報RIを生成したりする。
【0092】
ここで、情報処理装置100をマテリアルインフォマティクスの分野に適用した場合、前記回答情報RIには、文献情報と、物性名、物質名、組成名、物性値、単位、実験条件、及び実験装置の少なくとも何れとが含まれ得る。
【0093】
図7は、本ステップにおいて第2の生成部16が生成した回答情報RIを含む表示画面DIS2を示す図である。当該表示画面は、一例として、上述した「ステップS101~S104の各処理に関する具体例2」に対応する処理を行った情報処理装置100の回答情報表示用データ生成部161が生成する画面である。
【0094】
図7に示すように、表示画面DIS2には、回答情報RIが含まれており、当該回答情報RIには、出力情報OUT1及び出力情報OUT2が含まれている。ここで、出力情報OUT1は、一例としてプロンプトPR1に含まれていた第1の対象チャンクTCの要約であり、出力情報OUT2は、一例としてプロンプトPR1に含まれていた第2の対象チャンクTCの要約である。
【0095】
また、図7に示すように回答情報RIには、出力情報OUT1の抽出元の文書のタイトル及び書誌事項、並びに、出力情報OUT2の抽出元の文書のタイトル及び書誌事項が含まれている。第2の生成部16は、一例として、言語モデルLMが出力する出力情報OUT1及び出力情報OUT2のそれぞれに含まれるチャンクIDを参照することによって、当該出力情報を生成するために言語モデルLMが参照したチャンクを特定することができる。そして、第2の生成部16は、特定したチャンクの抽出元の文書を特定することにより、図7に示すように、回答情報RIに、出力情報OUT1の抽出元の文書のタイトル及び書誌事項、並びに、出力情報OUT2の抽出元の文書のタイトル及び書誌事項を含める処理を行うことができる。
【0096】
また、第2の生成部16が生成する回答情報RIには、実際に使用した費用を表示する領域(図7におけるCOST2)を含んでいてもよい。また、図7に示すように、表示画面DIS2には「文書へのリンク」ボタンL1~L3が含まれており、ユーザが当該ボタンを押下することによって、当該文書へのリンク先にアクセス可能な構成としてもよい。
【0097】
情報処理装置100は、上述のように、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する1又は複数の適合チャンクACを含むプロンプトを生成する。これは、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する内容をより多く含む要約を生成するための指示情報を生成すると表現することもできる。このような処理を行うことによって、情報処理装置100は、ユーザにとって有用な情報を含む要約を生成することができる。
【0098】
(実施形態1の付記事項1)
上述したように、複数の対象チャンクTCが存在する場合、情報処理装置100は、プロンプトPRに含める対象チャンクを変更しつつ、上述したステップS104~ステップS107の処理を複数回行ってもよい。ここで、情報処理装置100は、一例として、言語モデルLMの仕様を満たすよう、プロンプトPRに含める対象チャンクの長さを調整しつつ、上述したステップS104~ステップS107の処理を複数回行ってもよい。一例として、対象チャンクTCとして、対象チャンクTC01~TC08という8個のチャンクが存在する場合、情報処理装置100の制御部110は、
・対象チャンクTC01~TC04の4つの対象チャンクと、上述した指示文INとを含むプロンプトPR01を生成し、当該プロンプトPRに基づき言語モデルが出力した出力情報OUT01を取得し、
・対象チャンクTC05~TC08の4つの対象チャンクと、上述した指示文INとを含むプロンプトPR02を生成し、当該プロンプトPR02に基づき言語モデルが出力した出力情報OUT02を取得する
という構成としてもよい。
【0099】
上記構成の場合、ステップS109において、第2の生成部16は、まず、出力情報OUT01~OUT02を統合し、統合後の出力情報を参照して、回答情報RIを生成する構成とすればよい。また、当該統合処理の少なくとも一部を、言語モデルLMを用いて行ってもよい。
【0100】
このように、第1の生成部13は、
前記1又は複数の対象チャンクTCの第1の部分と、前記クエリQRから得られる指示文INとを含む第1の指示情報(プロンプト01)と、
前記1又は複数の対象チャンクTCの第2の部分と、前記クエリQRから得られる指示文INとを含む第2の指示情報(プロンプト02)と
を生成し、
前記第2の取得部14は、
前記第1の指示情報(プロンプト01)が入力された前記言語モデルLMが出力する第1の出力情報(OUT01)と、
前記第2の指示情報(プロンプト02)が入力された前記言語モデルLMが出力する第2の出力情報(OUT02)とを取得し、
前記第2の生成部16は、
前記第1の出力情報(OUT01)の少なくとも一部と前記第2の出力情報(OUT02)の少なくとも一部とを統合することによって前記回答情報RIを生成する
という構成としてもよい。
【0101】
上記の構成によれば、多数の対象チャンクが存在する場合であっても、一部の対象チャンクのみを含むプロンプトを繰り返し入力することにより、当該多数の対象チャンク全体に関する言語モデルLMの出力を取得することができる。このため、言語モデルLMに対して過度な負荷をかけることなく、又は当該言語モデルLMの仕様に沿った態様により、プロンプトPRの入力及び出力情報OUTの取得を好適に行うことができる。
【0102】
なお、実施形態2では、1つのプロンプトPRに複数のチャンクが含まれる例を挙げたが、これは実施形態2及び関連する記載を限定するものではない。1つのプロンプトPRに含めるチャンクの数を1つのみとする構成も本明細書に記載の内容に含まれる。より具体的には、
・第1の生成部13は、1つのプロンプトPRに含める対象チャンクの数が1つのみとなるよう構成され、
・当該プロンプトPRは上述のチャンクIDを含まない構成とする一方で、制御部110Aは、当該対象チャンクを当該対象チャンクの抽出元である文献IDと関連付けて管理し、
・第2の生成部16は、上記文献IDによって特定される文献情報を回答情報RIに含める
という構成としてもよい。
【0103】
(実施形態1の付記事項2)
上記付記事項1において、プロンプトPRに含める対象チャンクの長さを調整しつつ、上述したステップS104~ステップS107の処理を複数回行ってもよいことに言及したが、当該処理の例について更に説明すれば以下の通りである。
【0104】
すなわち、制御部110の各部は以下のような処理を行ってもよい。
・第1の生成部13は、複数の対象チャンクと、当該複数の対象チャンクの一次要約(仮の要約)を生成する旨の指示文とを含むプロンプトPR001を生成し、生成したプロンプトPR001を言語モデルLMに入力する。なお、上記複数の対象チャンクの長さが所定の長さ(一例として言語モデルLMの仕様上の長さ)よりも長い場合には、上記複数の対象チャンクを複数の部分に分割し、部分毎に一次要約を生成する旨のプロンプトを生成し、言語モデルLMに入力してもよい。
・続いて、上記言語モデルLMが生成した一次要約と、クエリQRに適合する適合チャンクとを含むプロンプトであって、当該一次要約の要約(最終的な要約)を生成する旨の指示文を含むプロンプトPR002を生成し、生成したプロンプトPR002を言語モデルLMに入力する
・続いて、第2の取得部14は、上記プロンプトPR002が入力された言語モデルLMが出力する最終的な要約を取得する。
【0105】
上記のような処理を行うことにより、言語モデルLMに対して過度な負荷をかけることなく、又は当該言語モデルLMの仕様に沿った態様により、要約の生成を好適に行うことができる。
【0106】
なお、対象文書(対象チャンク)に元から要約部分(一例として対象文書が論文である場合のアブストラクト等)が存在する場合には、当該要約部分を、上述の一次要約として用いる構成としてもよい。
【0107】
(実施形態1の付記事項3)
本実施形態に係る情報処理装置100は、任意の分野におけるデータ生成に適用することができる。上述した説明では、情報処理装置100を主としてマテリアルインフォマティクスの分野におけるデータ生成に適用した場合を挙げたがもちろんこれに限定されるものではない。
【0108】
一例として、第1の取得部11は、クエリQRとして、
・条件文「交差点での衝突事故の発生状況」
を取得し、第1の生成部13は、当該クエリQRを参照して指示文INを生成すると共に、生成された指示文INと、1又は複数の対象チャンクTCとを含むプロンプトPRを生成する構成としてもよい。ここで、当該対象チャンクTCとしては、一例として、ニュースを含むチャンク群から選択されたチャンクを用いることができる。そして、第2の取得部14は、当該プロンプトPRが入力された言語モデルLMが出力した出力情報OUTを取得し、第2の生成部16は、出力情報OUTを参照して、回答情報RIを生成してもよい。
【0109】
一方で、マテリアルインフォマティクス及びそれに関連する分野では、ユーザに対して提供するためのデータを生成するにあたり、参照可能な論文や技報等が多数存在している。このため、これらの論文や技報等の要約を生成したとしても、ユーザにとって有用な情報を含む要約になっていない場合が多いという問題がある。本実施形態に係る情報処理装置100によれば、上述のように、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する1又は複数の適合チャンクACを含むプロンプトを生成する。これは、1又は複数の対象チャンクTCの要約を生成するための指示情報であって、クエリQRに適合する内容をより多く含む要約を生成するための指示情報を生成すると表現することもできる。このような処理を行うことによって、マテリアルインフォマティクス及びそれに関連する分野において、情報処理装置100は、ユーザにとって有用な情報を含む要約を生成することができる。
【0110】
また、マテリアルインフォマティクス及びそれに関連する分野では、言語モデルLMへの入力の候補となり得るチャンクのデータ量も増大してしまう傾向にあるが、情報処理装置100によれば、クエリQRを参照してチャンク群CGから1又は複数の対象チャンクを抽出する。このため、言語モデルLMに入力するチャンクのデータ量を好適に抑制しつつ、言語モデルLMによるデータ生成(出力情報OUTの生成)において有用性の高い対象チャンクを用いることができる。したがって、情報処理装置100によれば、マテリアルインフォマティクス及びそれに関連する分野において、コストの上昇を抑えつつ、正確性の高いデータを生成することができる。
【0111】
(実施形態1の付記事項4)
上記実施形態において、プロンプトPRに含める対象チャンクTCの長さは特に限定されない。一方で、プロンプトPRに含める対象チャンクTCの長さ、数、種類等に応じて、言語モデルLMが出力する出力情報OUTの精度、及び出力情報OUTを取得するためのコストは変動し得る。このため、情報処理装置100において、対象チャンクTCの長さ、数、種類等を予め設定可能な構成としてもよい。
【0112】
一例として、情報処理装置100は、入出力部140を介して、対象チャンクTCの長さ、数、種類等の少なくとも何れかを指定する情報をユーザから受け付け可能な構成としてもよい。
【0113】
例えば、情報処理装置100は、入出力部140を介して、
・プロンプトPRに含める対象チャンクTCの最小文字数及び最大文字数
・プロンプトPRに含める対象チャンクTCの最小数及び最大数
・プロンプトPRに含める対象チャンクTCの種類(文節単位とするのか、文章単位とするのか、段落単位とするのか、章単位とするのか等)
を受け付け、当該受け付けた情報を満たすよう、第1の生成部13がプロンプトPRを生成する構成としてもよい。
【0114】
或いは、情報処理装置100は、
・プロンプトPRを生成する毎に、当該プロンプトPRに含めた対象チャンクTCの長さ、数、種類等を保持し、
・これらの情報と当該プロンプトPRに基づく出力情報OUTの精度及びコストとを関連付けて管理し、
・上記精度及びコストがユーザが所望する値に近づくための、好ましい対象チャンクTCの長さ、数、種類を決定(更新)し、次回のプロンプトPRの生成処理に反映させる
という構成としてもよい。
【0115】
〔実施形態2〕
本発明の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
【0116】
(情報処理システム1A)
図8は本実施形態に係る情報処理システム1Aの構成を示す図である。図8に示すように、本実施形態に係る情報処理システム1Aは、実施形態1に係る情報処理システム1が備える各構成に加え、複数の文書サーバ(図8における第1の文書サーバ300、第2の文書サーバ400、・・・)を備えている。
【0117】
ここで、第1の文書サーバ300は、一例として、無料または有償の論文を配信する論文配信サーバである。また、第2の文書サーバは、一例として、対象企業が管理するサーバであって、当該対象企業の技報や社内文書を管理するサーバである。ただし、これらの例は本実施形態を限定するものではない。
【0118】
(情報処理装置100A)
本実施形態に係る情報処理システム1Aが備える情報処理装置100Aは、図8に示すように、以下の点を除き、実施形態1に係る情報処理装置100と同様の構成を備えている。すなわち、本実施形態に係る情報処理装置100Aは、実施形態1に係る情報処理装置100が備える各構成に加えて、登録部35を備えている。
【0119】
(登録部35)
登録部35は、第1の文書サーバ300及び第2の文書サーバ400から、対象の文書を取得し、取得した文書をチャンクに分解することによって複数のチャンクを取得し、取得した複数のチャンクを記憶部120に格納する。これら複数のチャンクは、図8におけるチャンク群CGを構成する。
【0120】
また、登録部35は、チャンク群CGに含まれる1又は複数のチャンクの各々についてのベクトル(特徴量空間における特徴ベクトル)を生成し、生成したベクトルを記憶部120に格納する。これらのベクトルは、図8におけるベクトル群VGを構成する。なお、登録部35は、1又は複数のチャンクの各々に対して所定のアルゴリズムを適用することによって、チャンクから特徴ベクトルへの変換(特徴量空間へのチャンクの埋め込み(embedding))を行うことができる。また、登録部35による上記の処理の少なくとも一部を、一例として、サーバ200等の情報処理装置100Aとは別体の装置によって行う構成としてもよい。
【0121】
上記のように構成された情報処理装置100Aによれば、言語モデルLMによるデータ生成(出力情報OUTの生成)において参照される対象チャンクTCの元となる複数のチャンクを好適に準備しておくことができる。また、上記の構成によれば、複数のサーバから文書を取得し、チャンクを抽出するので、様々な分野の論文や様々な企業の文書等を用いたデータ生成(出力情報OUTの生成)を行うことができる。また、情報処理装置100Aによれば、実施形態1に係る情報処理装置100と同様の効果を奏する。
【0122】
〔ソフトウェアによる実現例〕
情報処理装置100、100Aの機能的な各ブロック(特に第1の取得部11、第1の抽出部12、第1の生成部13、第2の取得部14、第2の抽出部15、第2の生成部16、登録部35)、及びサーバ200の機能的な各ブロック(特に制御部240)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。後者の場合、情報処理装置100、100Aおよびサーバ200の各々は、例えば、コンピュータ(電子計算機)を用いて構成することができる。図9は、情報処理装置100(又は情報処理装置100A)およびサーバ200として用いられるコンピュータの物理的構成を例示したブロック図である。
【0123】
(情報処理装置100の物理的構成)
情報処理装置100(又は情報処理装置100A)は、図9に示すように、バス110と、プロセッサ101と、主メモリ102と、補助メモリ103と、通信インタフェース104と、入出力インタフェース105とを備えたコンピュータによって構成可能である。プロセッサ101、主メモリ102、補助メモリ103、通信インタフェース104、および入出力インタフェース105は、バス110を介して互いに接続されている。入出力インタフェース105には、入力装置40、出力装置50が接続されている。
【0124】
プロセッサ101としては、例えば、マイクロプロセッサ、デジタルシグナルプロセッサ、マイクロコントローラ、またはこれらの組み合わせ等が用いられる。主メモリ102としては、例えば、半導体RAM(random access memory)等が用いられる。
【0125】
補助メモリ103としては、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、またはこれらの組み合わせ等が用いられる。補助メモリ103には、プロセッサ101に上述した情報処理装置100(又は情報処理装置100A)の動作を実行させるためのプログラムが格納されている。プロセッサ101は、補助メモリ103に格納されたプログラムを主メモリ102上に展開し、展開したプログラムに含まれる各命令を実行する。また、補助メモリ103には、当該コンピュータを情報処理装置100(又は情報処理装置100A)として動作させるためにプロセッサ101が参照する各種データが格納されている。
【0126】
通信インタフェース104は、ネットワーク91に接続するインタフェースである。入出力インタフェース105としては、例えば、USB(Universal Serial Bus)インタフェース、赤外線やBluetooth(登録商標)等の近距離通信インタフェース、またはこれらの組み合わせが用いられる。
【0127】
入力装置40としては、例えば、キーボード、マウス、タッチパッド、マイク、又はこれらの組み合わせ等が用いられる。出力装置50としては、例えば、ディスプレイ、プリンタ、スピーカ、又はこれらの組み合わせが用いられる。
【0128】
(サーバ200の物理的構成)
サーバ200は、図9に示すように、バス210と、プロセッサ201と、主メモリ202と、補助メモリ203と、通信インタフェース204と、通信インタフェース205とを備えたコンピュータによって構成可能である。プロセッサ201、主メモリ202、補助メモリ203、通信インタフェース204、および通信インタフェース205は、バス210を介して互いに接続されている。
【0129】
プロセッサ201としては、例えば、マイクロプロセッサ、デジタルシグナルプロセッサ、マイクロコントローラ、またはこれらの組み合わせ等が用いられる。主メモリ202としては、例えば、半導体RAM等が用いられる。
【0130】
補助メモリ203としては、例えば、フラッシュメモリ、HDD、SSD、またはこれらの組み合わせ等が用いられる。補助メモリ203には、当該コンピュータをサーバ200として動作させるためのプログラムが格納されている。プロセッサ201は、補助メモリ203に格納されたプログラムを主メモリ202上に展開し、展開したプログラムに含まれる各命令を実行する。また、補助メモリ203には、当該コンピュータをサーバ200として動作させるためにプロセッサ201が参照する各種データとが格納されている。
【0131】
通信インタフェース204は、ネットワーク91に接続するインタフェースである。通信インタフェース205は、ネットワーク92に接続するインタフェースである。
【0132】
なお、上述した各プログラムは、補助メモリ103または補助メモリ203にそれぞれ記憶される代わりに、外部記録媒体に記録され、外部記録媒体から読み込まれることにより該当するコンピュータに供給されてもよい。外部記録媒体としては、コンピュータ読み取り可能な「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブル論理回路などを用いることができる。また、上述した各プログラムは、伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介してコンピュータに供給されてもよい。また、本発明の一態様は、各プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0133】
〔まとめ〕
本明細書に記載の事項には、少なくとも以下の構成が含まれる。
【0134】
(構成1)
クエリを取得する第1の取得部と、
前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出部と、
前記1又は複数の対象チャンクの要約を生成するための指示情報であって、前記1又は複数の適合チャンクを含む指示情報を生成する第1の生成部と、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得部と
を備えている情報処理装置。
【0135】
上記の構成によれば、ユーザにとって有用な情報を含む要約を生成することができる。
【0136】
(構成2)
前記指示情報には、前記要約に、前記適合チャンクに対応する内容を含める旨の指示が含まれている
構成1に記載の情報処理装置。
【0137】
上記の構成によれば、指示情報には、前記要約に、前記適合チャンクに対応する内容を含める旨の指示が含まれているので、ユーザにとって有用な情報を含む要約を生成することができる。
【0138】
(構成3)
前記出力情報を参照して回答情報を生成する第2の生成部
を更に備えている
構成1又は2に記載の情報処理装置。
【0139】
上記の構成によれば、前記出力情報を参照して回答情報を生成するので、ユーザにとって有用な情報を含む要約を含む回答情報を生成することができる。
【0140】
(構成4)
前記第2の生成部は、
前記回答情報を含む表示用データを生成する回答情報表示用データ生成部を備えている
構成3に記載の情報処理装置。
【0141】
上記の構成によれば、上記回答情報表示用データを提示することにより、ユーザは、上記回答情報の内容を容易に把握することができる。
【0142】
(構成5)
1又は複数のチャンクから前記対象チャンクを抽出する第2の抽出部を更に備えている
構成1から4の何れか1項に記載の情報処理装置。
【0143】
上記の構成によれば、1又は複数のチャンクから前記対象チャンクを抽出するので、コストの上昇を抑えつつ、正確性の高いデータ(要約)を生成することができる。
【0144】
(構成6)
前記第2の抽出部は、
前記複数のチャンクのうち、前記クエリに整合する1又は複数のチャンクを前記1又は複数の対象チャンクとして取得する
構成5に記載の情報処理装置。
【0145】
上記の構成によれば、上記クエリに整合するチャンクを対象チャンクとして取得するので、チャンクの絞り込みを好適に行うことができる。したがって、チャンクを参照した処理のコストを好適に低減することができる。
【0146】
(構成7)
前記第2の抽出部は、
前記複数のチャンクのうち、前記第クエリに整合する1又は複数のチャンクを取得し、
前記クエリに整合する1又は複数のチャンクに対して拡大処理を適用することによって前記1又は複数の対象チャンクを取得する
構成5に記載の情報処理装置。
【0147】
上記の構成によれば、上記第2の抽出部が拡大処理を適用することによって、好適な分量の対象チャンクを用意することができるので、チャンクを参照して生成されるデータの正確性を向上させることができる。
【0148】
(構成8)
前記第1の生成部は、
前記指示情報の少なくとも一部を含む表示用データを生成する指示情報表示用データ生成部を備えている
構成1から7の何れか1項に記載の情報処理装置。
【0149】
上記の構成によれば、上記指示情報表示用データを提示することにより、ユーザは、上記指示情報の内容を容易に把握することができる。
【0150】
(構成9)
前記クエリには、
物性名、物質名、組成名、物性値、単位、実験条件、及び実験装置の少なくとも何れかが含まれており、
前記出力情報には、
文献情報と、物性名、物質名、組成名、物性値、単位、実験条件、及び実験装置の少なくとも何れとが含まれている
構成1から8の何れか1項に記載の情報処理装置。
【0151】
上記の構成によれば、マテリアルインフォマティクス及び関連する分野において、ユーザにとって有用な情報を含む要約を生成することができる。
【0152】
(構成10)
前記第1の生成部は、
前記1又は複数の対象チャンクの第1の部分と、前記クエリから得られる指示文とを含む第1の指示情報と、
前記1又は複数の対象チャンクの第2の部分と、前記クエリから得られる指示文とを含む第2の指示情報と
を生成し、
前記第2の取得部は、
前記第1の指示情報が入力された前記言語モデルが出力する第1の出力情報と、
前記第2の指示情報が入力された前記言語モデルが出力する第2の出力情報と
を取得し、
前記第2の生成部は、
前記第1の出力情報の少なくとも一部と前記第2の出力情報の少なくとも一部とを統合することによって前記回答情報を生成する
構成3又は4に記載の情報処理装置。
【0153】
上記の構成によれば、言語モデルLMに対して過度な負荷をかけることなく、又は当該言語モデルLMの仕様に沿った態様により、指示情報の入力及び出力情報の取得を好適に行うことができる。
【0154】
(構成11)
クエリを取得する第1の取得部と、
1又は複数の対象チャンクの要約を生成するための指示情報であって、前記クエリに適合する内容をより多く含む要約を生成するための指示情報を生成する第1の生成部と、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得部と
を備えている情報処理装置。
【0155】
上記の構成によれば、構成1に係る情報処理装置と同様の効果を奏する。
【0156】
(構成12)
前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出部を更に備え、
前記第1の生成部は、前記指示情報に、前記1又は複数の適合チャンクを含める
構成11に記載の情報処理装置。
【0157】
上記の構成によれば、前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出し、指示情報には、前記1又は複数の適合チャンクが含まれているので、ユーザにとって有用な情報を含む要約を生成することができる。
【0158】
(構成13)
情報処理装置が実行する情報処理方法であって、
クエリを取得する第1の取得ステップと、
前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出ステップと、
前記1又は複数の対象チャンクの要約を生成するための指示情報であって、1又は複数の適合チャンクを含む指示情報を生成する第1の生成ステップと、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得ステップと
を含んでいる情報処理方法。
【0159】
上記の方法によれば、構成1に係る情報処理装置と同様の効果を奏する。
【0160】
(構成14)
情報処理装置が実行する情報処理方法であって、
クエリを取得する第1の取得ステップと、
1又は複数の対象チャンクの要約を生成するための指示情報であって、前記クエリに適合する内容をより多く含む要約を生成するための指示情報を生成する第1の生成ステップと、
前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得ステップと
を含んでいる情報処理方法。
【0161】
上記の方法によれば、構成1に係る情報処理装置と同様の効果を奏する。
【0162】
(構成15)
構成1に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、上記第1の取得部、上記第1の抽出部、上記第1の生成部、および上記第2の取得部としてコンピュータを機能させるためのプログラム。
【0163】
上記の構成によれば、構成1に係る情報処理装置と同様の効果を奏する。
【0164】
(構成16)
構成11に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、上記第1の取得部、上記第1の生成部、および上記第2の取得部としてコンピュータを機能させるためのプログラム。
【0165】
上記の方法によれば、構成1に係る情報処理装置と同様の効果を奏する。
【0166】
(構成17)
構成15に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0167】
上記の方法によれば、構成1に係る情報処理装置と同様の効果を奏する。
【0168】
(構成18)
構成16に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0169】
上記の方法によれば、構成1に係る情報処理装置と同様の効果を奏する。
【0170】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0171】
100,100A ・・・ 情報処理装置
110,110A ・・・ 制御部
11 ・・・ 第1の取得部
12 ・・・ 第1の抽出部
13 ・・・ 第1の生成部
131 ・・・ 指示情報表示用データ生成部
14 ・・・ 第2の取得部
15 ・・・ 第2の抽出部
16 ・・・ 第2の生成部
161 ・・・ 回答情報表示用データ生成部
35 ・・・ 登録部
200 ・・・ サーバ
【要約】
【課題】ユーザにとって有用な情報を含む要約を生成する
【解決手段】情報処理装置(100)は、クエリを取得する第1の取得部(11)と、前記クエリを参照して、1又は複数の対象チャンクから、前記クエリに適合するチャンクである1又は複数の適合チャンクを抽出する第1の抽出部(12)と、前記1又は複数の対象チャンクの要約を生成するための指示情報であって、前記1又は複数の適合チャンクを含む指示情報を生成する第1の生成部(13)と、前記指示情報が入力された言語モデルが出力する出力情報を取得する第2の取得部(14)とを備えている。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9