(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-03-18
(45)【発行日】2025-03-27
(54)【発明の名称】情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
H04N 21/232 20110101AFI20250319BHJP
H04N 21/47 20110101ALI20250319BHJP
【FI】
H04N21/232
H04N21/47
(21)【出願番号】P 2025019025
(22)【出願日】2025-02-07
【審査請求日】2025-02-07
【早期審査対象出願】
(73)【特許権者】
【識別番号】518136084
【氏名又は名称】MIL株式会社
(74)【代理人】
【識別番号】110002790
【氏名又は名称】One ip弁理士法人
(72)【発明者】
【氏名】光岡 敦
【審査官】大西 宏
(56)【参考文献】
【文献】特開2025-013258(JP,A)
【文献】特許第7586541(JP,B1)
【文献】特許第7627075(JP,B1)
【文献】米国特許出願公開第2024/0289546(US,A1)
【文献】米国特許第12149497(US,B1)
【文献】中国特許出願公開第118828043(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 -21/858
(57)【特許請求の範囲】
【請求項1】
複数の動画データを記憶する動画データ記憶部と、
ユーザからの質問を取得する質問取得部と、
前記動画データに関する情報、前記質問、及び前記質問に対して提供する前記動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、前記動画データの中から前記質問に対して回答するための前記動画データを決定する再生動画決定部と、
を備えることを特徴とする情報処理システム。
【請求項2】
請求項1に記載の情報処理システムであって、
前記再生動画決定部は、前記質問に対して提供する前記動画データ及び再生順を作成する指示を前記プロンプトに含めて、前記動画データの中から前記質問に対して回答するための前記動画データを選択し、選択した前記動画データの前記再生順を決定すること、
を特徴とする情報処理システム。
【請求項3】
請求項2に記載の情報処理システムであって、
前記再生動画決定部は、さらに前記動画データを選択した理由を説明する指示を含む前記プロンプトを前記大規模言語モデルに与えて前記理由を作成すること、
を特徴とする情報処理システム。
【請求項4】
請求項2に記載の情報処理システムであって、
前記再生順に前記動画データを再生する再生処理部を備えること、
を特徴とする情報処理システム。
【請求項5】
複数の動画データを記憶するステップと、
ユーザからの質問を取得するステップと、
前記動画データに関する情報、前記質問、及び前記質問に対して提供する前記動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、前記動画データの中から前記質問に対して回答するための前記動画データを決定するステップと、
をコンピュータが実行することを特徴とする情報処理方法。
【請求項6】
複数の動画データを記憶するステップと、
ユーザからの質問を取得するステップと、
前記動画データに関する情報、前記質問、及び前記質問に対して提供する前記動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、前記動画データの中から前記質問に対して回答するための前記動画データを決定するステップと、
をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
ユーザからの質問に回答するシステムが提供されている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年ではテキストよりも動画での情報提供を行いたいニーズがあるが、ユーザからの質問に対して動画で適切に回答することは難しい。
【0005】
本発明はこのような背景を鑑みてなされたものであり、動画を効果的に選択可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するための本発明の主たる発明は、情報処理システムであって、複数の動画データを記憶する動画データ記憶部と、ユーザからの質問を取得する質問取得部と、前記動画データに関する情報、前記質問、及び前記質問に対して提供する前記動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、前記動画データの中から前記質問に対して回答するための前記動画データを決定する再生動画決定部と、を備えることを特徴とする。
【0007】
その他本願が開示する課題やその解決方法については、発明の実施形態の欄及び図面により明らかにされる。
【発明の効果】
【0008】
本発明によれば、動画を効果的に選択することができる。
【図面の簡単な説明】
【0009】
【
図1】情報処理システムの全体構成例を示す図である。
【
図2】管理サーバ2のハードウェア構成例を示す図である。
【
図3】管理サーバ2のソフトウェア構成例を示す図である。
【発明を実施するための形態】
【0010】
<システムの概要>
以下、本発明の一実施形態に係る情報処理システムについて説明する。本実施形態の情報処理システムは、ユーザからの質問に対して動画で回答を行うようにするものであり、複数準備してある動画のうちどの動画をどの順番でユーザに提供するかを大規模言語モデル(Large Language Model;LLM)を用いて決定するようにしている。
【0011】
図1は、情報処理システムの全体構成例を示す図である。本実施形態の情報処理システムは、管理サーバ2を含んで構成される。管理サーバ2は、ユーザ端末1と通信ネットワークを介して通信可能に接続される。通信ネットワークは、例えばインターネットであり、公衆電話回線網や携帯電話回線網、無線通信路、イーサネット(登録商標)などにより構築される。
【0012】
ユーザ端末1は、ユーザが操作するコンピュータである。ユーザ端末1は、例えば、スマートフォン、タブレットコンピュータ、パーソナルコンピュータなどとすることができる。
【0013】
管理サーバ2は、例えばワークステーションやパーソナルコンピュータのような汎用コンピュータとしてもよいし、あるいはクラウド・コンピューティングによって論理的に実現されてもよい。
【0014】
<管理サーバ>
図2は、管理サーバ2のハードウェア構成例を示す図である。なお、図示された構成は一例であり、これ以外の構成を有していてもよい。管理サーバ2は、CPU201、メモリ202、記憶装置203、通信インタフェース204、入力装置205、出力装置206を備える。記憶装置203は、各種のデータやプログラムを記憶する、例えばハードディスクドライブやソリッドステートドライブ、フラッシュメモリなどである。通信インタフェース204は、通信ネットワークに接続するためのインタフェースであり、例えばイーサネット(登録商標)に接続するためのアダプタ、公衆電話回線網に接続するためのモデム、無線通信を行うための無線通信機、シリアル通信のためのUSB(Universal Serial Bus)コネクタやRS232Cコネクタなどである。入力装置205は、データを入力する、例えばキーボードやマウス、タッチパネル、ボタン、マイクロフォンなどである。出力装置206は、データを出力する、例えばディスプレイやプリンタ、スピーカなどである。なお、後述する管理サーバ2の各機能部はCPU201が記憶装置203に記憶されているプログラムをメモリ202に読み出して実行することにより実現され、管理サーバ2の各記憶部はメモリ202及び記憶装置203が提供する記憶領域の一部として実現される。
【0015】
図3は、管理サーバ2のソフトウェア構成例を示す図である。管理サーバ2は、動画データ記憶部231と、質問取得部211と、再生動画決定部212と、再生処理部213と、を備える。
【0016】
<記憶部>
動画データ記憶部231は、動画データを記憶する。本実施形態では、動画データ記憶部231は、動画データとともに、動画データに関する情報(以下、動画情報)を記憶する。動画情報には、動画データの内容や属性等を表す任意の情報(メタデータ)を含めることができ、例えば、動画を特定する情報(例えば、動画ID)、動画のタイトル、動画の説明、動画データなどを含めることができる。また、動画情報のメタデータには、動画の再生時間、動画の作成日時、動画の作成者、動画の対象とする視聴者の属性、動画のカテゴリ、動画に関連するキーワードなども含めることができる。また、動画情報のメタデータには、動画の内容を表すサムネイル画像や、動画の字幕データ、動画の音声データから生成した文字起こしテキストデータ等も含めることもできる。なお、動画情報には、動画データの内容を含めずに、動画データを例えばファイルとして記憶させておき、ファイルを取得するための情報(以下、ファイル取得情報という。例えば、ファイルシステム上のパスやクラウドストレージにおけるデータを特定するURLなどとすることができる。)を記憶するようにして、ファイル取得情報に基づいて動画データを取得するようにしてもよい。動画データ記憶部231には、複数の動画データ(及び動画データに関する動画情報)が記憶される。動画情報のタイトルは、ファイル名に設定されていてもよい。動画の説明はテキストデータを想定するが、動画や音声などであってもよい。
【0017】
本実施形態では、短尺(例えば、15秒から1分程度)の動画データを数多く動画データ記憶部231に登録しておくことを想定する。例えば、1つのトピックやサブトピックについて1つの動画データを登録しておくことができる。本実施形態では、後述するように、これらの短尺の動画データをつなぎ合わせて回答を動的に生成する。
【0018】
<機能部>
質問取得部211は、ユーザからの質問を取得する。ユーザからの質問は、例えば、ユーザ端末1から受信することができる。また、ユーザから質問を受けたスタッフのユーザ端末1から、ユーザの指定とともに、当該ユーザからの質問の入力を受け付けるようにしてもよい。質問取得部211は、例えば、ユーザがBOTなどに入力したメッセージを質問として取得することができる。
【0019】
再生動画決定部212は、ユーザからの質問への回答として再生するべき動画データを決定する。再生動画決定部212は、動画データに関する情報と、質問と、質問に対して提供する動画データを選択する指示とを含むプロンプトを大規模言語モデルに与えて、動画データの中から質問に対して回答するための動画データを決定する。
【0020】
動画データに関する情報は、動画情報に含まれるタイトル又は動画の説明の少なくともいずれかとすることができる。動画データに関する情報には、上述した各種のメタデータを含めるようにしてもよい。プロンプトに含める動画データに関する情報は、例えば、動画データ記憶部231に記憶されている全ての動画データについてのものとすることができる。
【0021】
大規模言語モデルは、例えば、管理サーバ2が備えるようにすることができる。この場合、管理サーバ2は、大規模言語モデルを実行するためのプログラムを記憶装置203に記憶しておき、CPU201がそのプログラムを実行することにより、大規模言語モデルを実現することができる。また、大規模言語モデルは、管理サーバ2とは別のサーバが備えるようにしてもよい。この場合、管理サーバ2は、外部のAPI(Application Programming Interface)を利用して、大規模言語モデルにアクセスすることができる。例えば、管理サーバ2は、所定のURL(Uniform Resource Locator)に対してHTTP(Hypertext Transfer Protocol)リクエストを送信し、その応答として大規模言語モデルの処理結果を取得することができる。大規模言語モデルとしては、GPT-3(Generative Pre-trained Transformer 3)、PaLM(Pathways Language Model)、Chinchilla、OPT(Open Pre-trained Transformer)などを用いることができる。また、これらの大規模言語モデルをファインチューニングしたものを用いてもよい。
【0022】
再生動画決定部212は、再生すべき動画データとともに、その再生順も決定することができる。
【0023】
再生動画決定部212は、質問に対して提供する動画データの再生順を決定する際、様々な方法を用いることができる。例えば、再生動画決定部212は、選択された動画データの内容と質問の内容とを比較し、質問の内容に関連する事項が説明されている順に動画データを並べることで、再生順を決定することができる。また、再生動画決定部212は、選択された動画データの内容同士を比較し、関連する内容の動画データを連続させるように並べることで、再生順を決定することもできる。さらに、再生動画決定部212は、動画データに予め設定されている優先度や重要度などに基づいて、再生順を決定することもできる。
【0024】
本実施形態では、再生動画決定部212は、大規模言語モデルを使用して再生順を決定する。例えば、再生動画決定部212は、動画データに関する情報と、質問と、質問に対して提供する動画データを選択するとともにその再生順を決める指示を含むプロンプトを大規模言語モデルに与えて、動画データの中から質問に対して回答するための動画データとその再生順を決定することができる。
【0025】
再生動画決定部212により決定された再生順は、様々な形式で表現することができる。例えば、再生順は、動画データに付与された番号の順序として表現することができる。この場合、再生動画決定部212は、選択された動画データに対して、再生すべき順に番号を付与することができる。また、再生順は、動画データのファイル名を並べたリストとして表現することもできる。この場合、再生動画決定部212は、選択された動画データのファイル名を、再生すべき順に並べたリストを生成することができる。さらに、再生順は、動画データの再生開始時間と再生終了時間を示したリストとして表現することもできる。この場合、再生動画決定部212は、選択された動画データごとに再生開始時間と再生終了時間を決定し、それらを再生すべき順に並べたリストを生成することができる。
【0026】
再生動画決定部212は、再生すべき動画データを選択するとともに、その動画を選択した理由(質問に対してその動画を視聴すべき理由)を生成するようにしてもよい。再生動画決定部212は、動画を視聴すべき理由を説明する指示を含むプロンプトを大規模言語モデルに与えて理由を生成させることができる。この場合、再生動画決定部212は、動画データに関する情報と、質問と、質問に対して提供する動画データとその理由を考える指示とを含むプロンプトを大規模言語モデルに与えることができる。また、動画を選択させた後に、別のプロンプトでその理由を生成させるようにしてもよい。この場合、再生動画決定部212は、質問と、選択された動画データに関する情報と、動画データを選択した理由を説明する指示とを含むプロンプトを大規模言語モデルに与えることができる。再生動画決定部212は、動画データを選択するとともに、選択した理由と、その再生順とを考える指示をプロンプトに含めるようにしてもよい。
【0027】
また、再生動画決定部212は、選択された動画データのタイトルや説明文に含まれるキーワードと、質問に含まれるキーワードとの関連性を分析し、関連性の高いキーワードを含む文を理由の一部として生成するように大規模言語モデルに指示するようにしてもよい。また、再生動画決定部212は、選択された動画データの内容を要約したテキストデータを生成し、そのテキストデータと質問とを比較して、質問の内容を説明するのに適した部分を抽出し、抽出した部分を理由の一部として生成するように大規模言語モデルに指示することもできる。また、再生動画決定部212は、選択された動画データに関連する他の動画データのタイトルや説明文を参照し、それらと質問との関連性を分析することで、選択された動画データが質問への回答として適切である理由を生成するように大規模言語モデルに指示することもできる。
【0028】
再生処理部213は、再生順に動画データを再生するための処理を行う。再生処理部213は、再生動画決定部212が決定した動画データの一覧を出力(例えばユーザ端末1に送信)することができる。再生処理部213は、決定された動画データの一覧を、決定された再生順に並べて出力するようにしてもよい。再生処理部213は、決定された動画データの一覧を、決定された再生順に並べるとともに、動画データを視聴すべき理由を動画データに付帯させるようにしてもよい。
【0029】
再生処理部213は、再生動画決定部212が決定した動画データを、決定した再生順に連続して再生されるように制御することができる。再生処理部213は、例えば、決定した動画データを、決定した再生順に連続してユーザ端末1に送信してユーザ端末1において連続して再生されるようにすることができる。例えば、再生処理部213は、動画データをストリーミング配信することができる。ストリーミング配信の方式としては、例えば、HTTP Live Streaming(HLS)、Real-Time Messaging Protocol(RTMP)、Real-Time Streaming Protocol(RTSP)、MPEG-DASH等の各種ストリーミングプロトコルを用いることができる。また、再生処理部213は、動画データをダウンロード配信することもできる。この場合、再生処理部213は、動画データをユーザ端末1にダウンロードさせた後に、ユーザ端末1のローカルストレージに保存された動画データを再生させるように制御することができる。再生処理部213は、決定した動画データに再生順を付帯させてユーザ端末1に送信し、ユーザ端末1において再生順に再生されるようにしてもよい。
【0030】
また、再生処理部213は、動画データとともに、その動画を視聴すべき理由を送信し、ユーザ端末1において、動画データの再生前、再生中、及び/又は再生後にその理由を表示させるようにしてもよい。
【0031】
<動作>
図4は、管理サーバ2の動作を説明する図である。
【0032】
管理サーバ2は、ユーザからの質問を取得し(S301)、質問、動画のタイトル/説明をLLMに与えて再生すべき動画・その順番を生成させ(S302)、選択された動画が再生順に再生されるように制御する(S303)。
【0033】
以上のようにして、本実施形態の情報処理システムによれば、予め準備した動画データの中から、ユーザからの質問に対する回答として適切なものを再生させることができる。また、本実施形態の情報処理システムによれば、質問に対する回答として適切なものを適切な順に再生させることもできる。また、本実施形態の情報処理システムによれば、提案された動画データを視聴すべき理由を表示させることもできる。
【0034】
以上、本実施形態について説明したが、上記実施形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。
【0035】
例えば、上述した管理サーバ2の各機能部による処理は、いずれの機能部により実行されるようにしてもよい。また、上述した各機能部の処理の一部を実行する異なる機能部を追加するようにしてもよい。また、管理サーバ2の機能部は、複数台のコンピュータが分散して備えるようにしてもよい。
【0036】
また、管理サーバ2の各記憶部が記憶する情報は、いずれの記憶部が記憶するようにしてもよい。すなわち、上述した複数の記憶部が記憶する情報を1つの記憶部により記憶するようにしてもよいし、上述したある記憶部が記憶する情報の一部を他の記憶部が記憶するようにしてもよい。
【0037】
<変形例1>
動画データに関する情報として、動画の作成日時、作成者、再生時間、対象とする視聴者の属性など、より多様な情報を含めることができる。
【0038】
例えば、動画情報には、動画の作成日時を示すタイムスタンプデータを含めることができる。質問に対して、最新の動画を優先的に選択したり、逆に古い動画を選択したりするなど、動画の作成日時に基づいて動画を選択することができる。
【0039】
例えば、動画情報には、動画の作成者を示す作成者情報を含めることができる。作成者情報としては、例えば、作成者の氏名、所属、肩書き、専門分野などを含めることができる。質問に対して、特定の作成者による動画を優先的に選択したり、複数の作成者による動画をバランス良く選択したりするなど、動画の作成者に基づいて動画を選択することができる。
【0040】
例えば、動画情報には、動画の再生時間を示す再生時間情報を含めることができる。質問に対して、再生時間が長い動画や短い動画を優先的に選択したり、再生時間の合計が所定の時間以内に収まるように動画を選択したりするなど、動画の再生時間に基づいて動画を選択することができるようになる。
【0041】
例えば、動画情報には、対象とする視聴者の属性を示す視聴者属性情報を含めることができる。視聴者属性情報としては、例えば、想定される視聴者の年齢層、性別、職業、興味関心などを含めることができる。質問をしたユーザの属性に合わせて動画を選択することができ、この選択した動画データに関する動画情報をプロンプトに与えて、選択した動画データの中からユーザに提案する動画データを選択するようにしてもよい。
【0042】
<変形例2>
再生動画決定部212は、動画データの選択を、大規模言語モデルを用いずに行うようにしてもよい。例えば、再生動画決定部212は、動画データのタイトルや説明文をベクトル化したデータを予め生成しておき、質問取得部211が取得した質問をベクトル化したデータとのコサイン距離を算出することで、質問に関連する動画データを選択することができる。
【0043】
例えば、再生動画決定部212は、各動画データについて、タイトルや説明文を形態素解析し、各形態素の出現頻度に基づいて、各動画データをベクトル化することができる。そして、再生動画決定部212は、質問取得部211が取得した質問についても同様に形態素解析し、ベクトル化することができる。そして、再生動画決定部212は、質問のベクトルと各動画データのベクトルとのコサイン距離を算出し、コサイン距離が小さい順に動画データを選択することができる。これにより、再生動画決定部212は、質問の内容に関連する動画データを適切に選択することができる。
【0044】
また、再生動画決定部212は、動画データのベクトル化の際に、タイトルや説明文以外の情報も用いるようにしてもよい。例えば、再生動画決定部212は、動画データに付与されたメタデータ(キーワードやカテゴリなど)や、動画データに対するユーザの評価(視聴回数、高評価数など)を用いて、動画データをベクトル化するようにしてもよい。これにより、再生動画決定部212は、質問との関連性がより高い動画データを選択することができる。
【0045】
また、再生動画決定部212は、質問に関連する動画データの選択を、コサイン距離以外の方法で行うようにしてもよい。例えば、再生動画決定部212は、質問のベクトルと各動画データのベクトルとのユークリッド距離を算出し、ユークリッド距離が小さい順に動画データを選択するようにしてもよい。また、再生動画決定部212は、質問のベクトルと各動画データのベクトルとの内積を算出し、内積が大きい順に動画データを選択するようにしてもよい。これらの方法を適宜選択することで、再生動画決定部212は、質問との関連性がより高い動画データを選択することができる。
【0046】
<変形例3>
再生動画決定部212は、質問に対して提供する動画データの再生順を、動画データ間の内容の関連性に基づいて決定することができる。例えば、再生動画決定部212は、動画データのタイトルや説明文に含まれるキーワードを抽出し、共通するキーワードを多く含む動画データ同士を連続して再生するような再生順を決定することができる。また、再生動画決定部212は、動画データの内容を表すメタデータ(例えば、動画に写っている物体やシーンを表すタグなど)を参照し、メタデータの類似度が高い動画データ同士を連続して再生するような再生順を決定することができる。これにより、内容の関連性が高い動画データを連続して再生させることができる。
【0047】
また、再生動画決定部212は、質問に対して提供する動画データの再生順を、質問と動画データの内容との関連性の高さに基づいて決定することができる。例えば、再生動画決定部212は、質問文に含まれるキーワードと、動画データのタイトルや説明文に含まれるキーワードとを比較し、キーワードの一致度が高い動画データから順に再生するような再生順を決定することができる。また、再生動画決定部212は、質問文の内容と、動画データの内容を表すメタデータとの類似度を算出し、類似度が高い動画データから順に再生するような再生順を決定することができる。これにより、質問の内容に関連性の高い動画データを優先的に再生させることができる。
【0048】
さらに、再生動画決定部212は、動画データ間の内容の関連性と、質問と動画データの内容との関連性の高さとを組み合わせて、再生順を決定することができる。例えば、再生動画決定部212は、まず質問との関連性が高い動画データを選択し、次にその選択された動画データ間の関連性に基づいて再生順を決定することができる。
【0049】
<変形例4>
再生動画決定部212は、動画を選択した理由を生成する際に、選択された動画の内容と質問の内容とを比較して、関連性の高い部分を抽出することで理由を生成するようにしてもよい。例えば、再生動画決定部212は、選択された動画の説明文や字幕データ等のテキストデータと、質問のテキストデータとを比較し、両者に共通して出現する単語や、同義語・類義語の関係にある単語を抽出し、抽出された単語を含む文や段落等を動画及び質問のテキストデータから抜き出し、これらを文章要約のアルゴリズムを用いて要約することで、動画を選択した理由を生成することができる。
【0050】
さらに、再生動画決定部212は、動画を選択した理由に、選択された動画の内容のうち質問の内容と関連性の高い部分の再生開始時間と終了時間を付加するようにしてもよい。再生処理部213は、この再生開始時間及び終了時間の情報に基づいて、動画の関連部分のみを再生するようにしてもよいし、関連部分の再生前や再生後に動画全体を再生するようにしてもよい。
【0051】
<変形例5>
【0052】
再生処理部213は、動画データを様々な方式で再生させることができる。例えば、再生処理部213は、動画データをストリーミング配信することができる。この場合、再生処理部213は、動画データをリアルタイムでユーザ端末1に送信し、ユーザ端末1において動画データを受信しながら再生させることができる。
【0053】
再生処理部213は、動画データをダウンロードさせてから再生させることもできる。この場合、再生処理部213は、動画データをユーザ端末1に送信し、ユーザ端末1において動画データを受信して記憶させる。ユーザ端末1において、記憶された動画データを再生させることができる。
【0054】
再生処理部213は、動画データのストリーミング配信とダウンロードとを組み合わせて再生させることもできる。例えば、再生処理部213は、動画データの一部をダウンロードさせてから再生を開始させ、残りの部分をストリーミング配信することができる。
【0055】
<開示事項>
なお、本開示には、以下のような構成も含まれる。
[項目1]
複数の動画データを記憶する動画データ記憶部と、
ユーザからの質問を取得する質問取得部と、
前記動画データに関する情報、前記質問、及び前記質問に対して提供する前記動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、前記動画データの中から前記質問に対して回答するための前記動画データを決定する再生動画決定部と、
を備えることを特徴とする情報処理システム。
[項目2]
項目1に記載の情報処理システムであって、
前記再生動画決定部は、前記質問に対して提供する前記動画データ及び再生順を作成する指示を前記プロンプトに含めて、前記動画データの中から前記質問に対して回答するための前記動画データを選択し、選択した前記動画データの前記再生順を決定すること、
を特徴とする情報処理システム。
[項目3]
項目2に記載の情報処理システムであって、
前記再生動画決定部は、さらに前記動画データを選択した理由を説明する指示を含む前記プロンプトを前記大規模言語モデルに与えて前記理由を作成すること、
を特徴とする情報処理システム。
[項目4]
項目2に記載の情報処理システムであって、
前記再生順に前記動画データを再生する再生処理部を備えること、
を特徴とする情報処理システム。
[項目5]
複数の動画データを記憶するステップと、
ユーザからの質問を取得するステップと、
前記動画データに関する情報、前記質問、及び前記質問に対して提供する前記動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、前記動画データの中から前記質問に対して回答するための前記動画データを決定するステップと、
をコンピュータが実行することを特徴とする情報処理方法。
[項目6]
複数の動画データを記憶するステップと、
ユーザからの質問を取得するステップと、
前記動画データに関する情報、前記質問、及び前記質問に対して提供する前記動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、前記動画データの中から前記質問に対して回答するための前記動画データを決定するステップと、
をコンピュータに実行させるためのプログラム。
【符号の説明】
【0056】
1 ユーザ端末
2 管理サーバ
【要約】
【課題】動画を効果的に選択することができるようにする。
【解決手段】情報処理システムであって、複数の動画データを記憶する動画データ記憶部と、ユーザからの質問を取得する質問取得部と、動画データに関する情報、質問、及び質問に対して提供する動画データを選択する指示を含むプロンプトを大規模言語モデルに与えて、動画データの中から質問に対して回答するための動画データを決定する再生動画決定部と、を備えることを特徴とする。
【選択図】
図1