IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

7609387情報処理装置、方法、プログラム及びシステム
<>
  • -情報処理装置、方法、プログラム及びシステム 図1
  • -情報処理装置、方法、プログラム及びシステム 図2
  • -情報処理装置、方法、プログラム及びシステム 図3
  • -情報処理装置、方法、プログラム及びシステム 図4
  • -情報処理装置、方法、プログラム及びシステム 図5
  • -情報処理装置、方法、プログラム及びシステム 図6
  • -情報処理装置、方法、プログラム及びシステム 図7
  • -情報処理装置、方法、プログラム及びシステム 図8
  • -情報処理装置、方法、プログラム及びシステム 図9
  • -情報処理装置、方法、プログラム及びシステム 図10
  • -情報処理装置、方法、プログラム及びシステム 図11
  • -情報処理装置、方法、プログラム及びシステム 図12
  • -情報処理装置、方法、プログラム及びシステム 図13
  • -情報処理装置、方法、プログラム及びシステム 図14
  • -情報処理装置、方法、プログラム及びシステム 図15
  • -情報処理装置、方法、プログラム及びシステム 図16
  • -情報処理装置、方法、プログラム及びシステム 図17
  • -情報処理装置、方法、プログラム及びシステム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-12-23
(45)【発行日】2025-01-07
(54)【発明の名称】情報処理装置、方法、プログラム及びシステム
(51)【国際特許分類】
   G06Q 50/20 20120101AFI20241224BHJP
【FI】
G06Q50/20
【請求項の数】 15
(21)【出願番号】P 2024167509
(22)【出願日】2024-09-26
【審査請求日】2024-09-26
【早期審査対象出願】
(73)【特許権者】
【識別番号】514312457
【氏名又は名称】千株式会社
(74)【代理人】
【識別番号】110002815
【氏名又は名称】IPTech弁理士法人
(72)【発明者】
【氏名】江川 健太郎
(72)【発明者】
【氏名】小川 正幹
(72)【発明者】
【氏名】堀 誉克
【審査官】星野 裕
(56)【参考文献】
【文献】特開2019-185188(JP,A)
【文献】特開2021-92945(JP,A)
【文献】特開2022-119063(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
プロセッサとメモリとを備えるコンピュータを動作させるためのプログラムであって、前記プログラムは、前記プロセッサに、
第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、
データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、前記生成対象として指定された前記児童または前記集団が関連する画像として特定するステップと、
特定された前記画像の状況を読み取ることと、読み取った前記状況に基づいて、前記生成対象として指定された前記児童または前記集団に関する文章案を生成することとを含むプロンプトを生成するステップと、
前記画像に関する情報を含む前記プロンプトを大規模言語モデルに入力することで、前記大規模言語モデルから前記文章案を取得するステップと、
取得した前記文章案を、前記第1のユーザに提示するステップと、
を実行させる、プログラム。
【請求項2】
前記文章案は、児童福祉に関する活動を記録するための書類に記載する文章の案である、請求項1に記載のプログラム。
【請求項3】
前記生成対象の指定を受け付けるステップにおいて、書類の種別の指定を受け付け、
前記プロンプトを生成するステップにおいて、指定された前記種別に応じて異なる指示を含むプロンプトを生成する、
請求項1に記載のプログラム。
【請求項4】
前記プロンプトを生成するステップにおいて、指定された前記種別に応じて異なる、前記文章案の出力形式に関する情報を含むプロンプトを生成する、
請求項3に記載のプログラム。
【請求項5】
前記生成対象の指定を受け付けるステップにおいて、1または複数の時間帯の指定を受け付け、
前記プログラムは、前記プロセッサに、指定された前記時間帯と特定された前記画像に関連付けられた時刻情報とに基づいて、前記時間帯に対応する画像を決定するステップを実行させ、
前記プロンプトを生成するステップにおいて、前記時間帯に対応する画像の状況を読み取ることで、前記時間帯に関する文章を含む文章案を生成する指示を含むプロンプトを生成する、
請求項1に記載のプログラム。
【請求項6】
前記特定するステップにおいて、複数の画像を特定し、
前記生成対象の指定を受け付けるステップにおいて、複数の時間帯の指定を受け付け、
前記時間帯に対応する画像を決定するステップにおいて、指定された前記複数の時間帯にそれぞれ対応する複数の画像を決定し、
前記プロンプトを生成するステップにおいて、前記複数の時間帯に対応する前記複数の画像の状況をそれぞれ読み取ることで、前記複数の時間帯ごとに区切られた文章を生成する指示を含むプロンプトを生成する、
請求項5に記載のプログラム。
【請求項7】
前記生成対象の指定を受け付けるステップにおいて、1つまたは複数の場面の指定を受け付け、
前記プロンプトを生成するステップにおいて、特定された前記画像から前記場面に対応する画像を決定することと、前記場面に対応する画像の状況を読み取ることと、前記場面に関する文章を含む文章案を生成することとを含むプロンプトを生成する、
請求項1に記載のプログラム。
【請求項8】
前記プログラムは、前記プロセッサに、
指定された前記児童または前記集団に所属する児童の状態に関する情報と時刻情報とが関連付けて記録されたログ情報を取得するステップを実行させ、
前記プロンプトを生成するステップにおいて、前記ログ情報を参照して前記文章案を生成する指示を含むプロンプトを生成する、
請求項1に記載のプログラム。
【請求項9】
前記生成対象の指定を受け付けるステップにおいて、1または複数の時間帯の指定を受け付け、
前記プロンプトを生成するステップにおいて、指定された前記時間帯と前記ログ情報に含まれる前記時刻情報とを参照して、前記時間帯に対応する児童の状態に関する文章を含む文章案を生成する指示を含むプロンプトを生成する、
請求項8に記載のプログラム。
【請求項10】
前記プロンプトを生成するステップにおいて、特定された前記画像から、生成した文章案に対する添付画像を選択する指示を含むプロンプトを生成し、
前記文章案を取得するステップにおいて、前記添付画像に関する情報を取得し、
前記文章案を提示するステップにおいて、取得した前記添付画像を提示する、
請求項1に記載のプログラム。
【請求項11】
前記プログラムは、前記プロセッサに、
前記大規模言語モデルから取得した前記文章案を、前記生成対象として指定された前記児童または前記集団に関連付けてデータベースに記憶するステップと、
第2のユーザから、評価対象として、児童または児童が所属する集団の指定を受け付けるステップと、
データベースに記憶される1または複数の前記文章案から、前記評価対象として指定された児童または児童が所属する集団に関連付けられた文章案を抽出するステップと、
抽出された前記文章案のテキストデータを分析することにより、前記評価対象として指定された児童または児童が所属する集団を評価するステップと、
評価の結果を前記第2のユーザに提示するステップと、
を実行させる、請求項1に記載のプログラム。
【請求項12】
前記評価するステップにおいて、抽出された前記文章案のテキストデータに対してテキストマイニングを行い、抽出された前記文章案の特徴を抽出することにより、前記評価対象として指定された児童または児童が所属する集団を評価する、
請求項11に記載のプログラム。
【請求項13】
プロセッサを備えるコンピュータによって実行される方法であって、前記プロセッサが、
第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、
データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、前記生成対象として指定された前記児童または前記集団が関連する画像として特定するステップと、
特定された前記画像の状況を読み取ることと、読み取った前記状況に基づいて、前記生成対象として指定された前記児童または前記集団に関する文章案を生成することとを含むプロンプトを生成するステップと、
前記画像に関する情報を含む前記プロンプトを大規模言語モデルに入力することで、前記大規模言語モデルから前記文章案を取得するステップと、
取得した前記文章案を、前記第1のユーザに提示するステップと、
を実行する方法。
【請求項14】
制御部を備える情報処理装置であって、前記制御部が、
第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、
データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、前記生成対象として指定された前記児童または前記集団が関連する画像として特定するステップと、
特定された前記画像の状況を読み取ることと、読み取った前記状況に基づいて、前記生成対象として指定された前記児童または前記集団に関する文章案を生成することとを含むプロンプトを生成するステップと、
前記画像に関する情報を含む前記プロンプトを大規模言語モデルに入力することで、前記大規模言語モデルから前記文章案を取得するステップと、
取得した前記文章案を、前記第1のユーザに提示するステップと、
を実行する情報処理装置。
【請求項15】
第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付ける手段と、
データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、前記生成対象として指定された前記児童または前記集団が関連する画像として特定する手段と、
特定された前記画像の状況を読み取ることと、読み取った前記状況に基づいて、前記生成対象として指定された前記児童または前記集団に関する文章案を生成することとを含むプロンプトを生成する手段と、
前記画像に関する情報を含む前記プロンプトを大規模言語モデルに入力することで、前記大規模言語モデルから前記文章案を取得する手段と、
取得した前記文章案を、前記第1のユーザに提示する手段と、
を具備するシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、方法、プログラム及びシステムに関する。
【背景技術】
【0002】
児童福祉施設における保育士、幼児教育者等のスタッフは、児童の生活支援および教育支援を行うことに加え、保護者との連絡、業務内容の記録、活動発信業務等の書類作成業務も行う。書類作成業務は、時間を要し且つ労力を伴うものであるため、効率化が求められている。
【0003】
特許文献1には、画像活用システム10が記載されている。特許文献1の画像活用システム10は、保育士用端末30や保護者用端末20の撮影機能において撮影された園児80を含む画像を取得して、取得した画像について、データの追加、及び/又は、データの削除、及び/又は、データの修正を含む、所定の加工を施した加工画像を生成して、加工画像を取り込んだデータを用い、各種サービスに用いるためのデータとしてのサービスデータを生成することにより、それぞれのコミュニケーションツールに適した加工画像を作成し、それぞれのコミュニケーションツールの目的に適した加工画像を自動的に選択し適用したコミュニケーションツールを作成することができ、これにより、保育園110等が作成するコミュニケーションツールに画像を適切に適用して業務の効率化を図ることができる、とされている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2022-071553号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の画像活用システムは、書類に記載する文章の作成について効率化が不十分であった。
【0006】
本開示の目的は、書類に記載する文章の作成を効率化することである。
【課題を解決するための手段】
【0007】
プログラムは、プロセッサに、第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童または集団が関連する画像として特定するステップと、特定された画像の状況を読み取ることと、読み取った状況に基づいて、生成対象として指定された児童または集団に関する文章案を生成することとを含む指示を含むプロンプトを生成するステップと、画像に関する情報を含むプロンプトを大規模言語モデルに入力することで、大規模言語モデルから文章案を取得するステップと、取得した文章案を、第1のユーザに提示するステップと、を実行させる。
【発明の効果】
【0008】
本開示によれば、書類に記載する文章の作成を効率化することができる。
【図面の簡単な説明】
【0009】
図1】システム1の機能構成を示すブロック図である。
図2】端末装置10の機能構成を示すブロック図である。
図3】サーバ20の機能構成を示すブロック図である。
図4】プロンプトPの構成の一例を示す図である。
図5】ユーザテーブル2021のデータ構造を示す図である。
図6】児童テーブル2022のデータ構造を示す図である。
図7】画像テーブル2023のデータ構造を示す図である。
図8】書類種別テーブル2024のデータ構造を示す図である。
図9】出力フォーマットテーブル2025のデータ構造を示す図である。
図10】文章テーブル2026のデータ構造を示す図である。
図11】ログ管理テーブル2027のデータ構造を示す図である。
図12】本実施形態の書類生成処理のフローチャートである。
図13】入力画面D1の例を示す模式図である。
図14】文章案表示画面D2の例を示す模式図である。
図15】本実施形態の評価処理のフローチャートである。
図16】条件設定画面D3の例を示す模式図である。
図17】結果表示画面D4の例を示す模式図である。
図18】コンピュータ90の基本的なハードウェア構成を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、本開示の実施形態について図面を参照して説明する。実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。なお、以下の実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態に示される構成要素のすべてが、本開示の必須の構成要素であるとは限らない。また、各図は模式図であり、必ずしも厳密に図示されたものではない。
【0011】
また、以下の説明において、「プロセッサ」は、1以上のプロセッサである。少なくとも1つのプロセッサは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサであるが、GPU(Graphics Processing Unit)のような他種のプロセッサでもよい。少なくとも1つのプロセッサは、シングルコアでもよいしマルチコアでもよい。
【0012】
また、少なくとも1つのプロセッサは、処理の一部又は全部を行うハードウェア回路(例えばFPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサでもよい。
【0013】
また、以下の説明において、「xxxテーブル」といった表現により、入力に対して出力が得られる情報を説明することがあるが、この情報は、どのような構造のデータでもよいし、入力に対する出力を発生するニューラルネットワークのような学習モデルでもよい。従って、「xxxテーブル」を「xxx情報」と言うことができる。
【0014】
また、以下の説明において、各テーブルの構成は一例であり、1つのテーブルは、2以上のテーブルに分割されてもよいし、2以上のテーブルの全部又は一部が1つのテーブルであってもよい。
【0015】
また、以下の説明において、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサによって実行されることで、定められた処理を、適宜に記憶部及び/又はインタフェース部などを用いながら行うため、処理の主語が、プロセッサ(或いは、そのプロセッサを有するコントローラのようなデバイス)とされてもよい。
【0016】
プログラムは、計算機のような装置にインストールされてもよいし、例えば、プログラム配布サーバ又は計算機が読み取り可能な(例えば非一時的な)記録媒体にあってもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
【0017】
また、以下の説明において、種々の対象の識別情報として、識別番号が使用されるが、識別番号以外の種類の識別情報(例えば、英字や符号を含んだ識別子)が採用されてもよい。
【0018】
また、以下の説明において、同種の要素を区別しないで説明する場合には、参照符号(又は、参照符号のうちの共通符号)を使用し、同種の要素を区別して説明する場合は、要素の識別番号(又は参照符号)を使用することがある。
【0019】
また、以下の説明において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
【0020】
各情報処理装置は演算装置と記憶装置とを備えたコンピュータにより構成されている。コンピュータの基本ハードウェア構成および、当該ハードウェア構成により実現されるコンピュータの基本機能構成は後述する。端末装置10、サーバ20のそれぞれについて、後述するコンピュータの基本ハードウェア構成およびコンピュータの基本機能構成と重複する説明は省略する。
【0021】
<定義>
本開示において、書類とは、児童福祉に関する活動に関連する書類である。書類は、例えば、児童福祉施設で勤務する者(保育士等)が記録、報告等に利用する書類(日誌、報告書、業務記録、計画書等)、児童福祉施設に所属する者(児童等)や保護者への報告に利用する書類(連絡帳、おたより等)を含む。
【0022】
本開示において、児童とは、児童福祉施設に所属する(通っている)児童である。児童が所属する集団とは、児童福祉施設において、児童を含む集団であり、例えば、児童福祉施設、年次、クラス、班等を含む。なお、以下の説明において、「児童または児童が所属する集団」を、単に「児童等」と称する。
【0023】
<構成>
第1実施形態の情報処理システムの構成について説明する。図1は、第1実施形態の情報処理システムの構成を例示するブロック図である。
【0024】
図1に示すように、情報処理システム1は、端末装置10と、サーバ20と、生成AI40とを含む。
【0025】
図1において、システム1に含まれる端末装置10の数は、1台に限定されない。システム1に含まれる端末装置10は、2台以上であってもよい。
【0026】
図1において、システム1がサーバ20を1台ずつ含む例を示しているが、システム1に含まれるサーバ20の数は、1台に限定されない。サーバ20は、有する機能に応じ、それぞれ複数のサーバから構成されていてもよい。また、サーバ20は、例えば、それぞれ、複数の装置の集合体を1つのサーバとしてもよい。1つ又は複数のハードウェアに対して本実施形態に係るサーバ20を実現することに要する複数の機能の配分の仕方は、各ハードウェアの処理能力及び/又はサーバ20に求められる仕様等に鑑みて適宜決定することができる。
【0027】
図1に示す端末装置10は、例えば、据え置き型のPC(Personal Computer)、ラップトップPCにより実現される。また、端末装置10は、移動体通信システムに対応したスマートフォン、タブレット等の携帯端末等により実現されてもよい。また、端末装置10は、例えば、HMD(Head Mount Display)等のウェアラブル端末により実現されてもよい。
【0028】
端末装置10は、通信IF(Interface)12と、入力装置13と、出力装置14と、メモリ15と、ストレージ16と、プロセッサ19とを備える。入力装置13は、ユーザからの入力操作を受け付けるための装置(例えば、タッチパネル、タッチパッド等)である。出力装置14は、ユーザに対して情報を提示するための装置(ディスプレイ、スピーカー等)である。
【0029】
サーバ20は、例えば、ネットワーク80に接続された情報処理装置により実現される。図1に示すように、サーバ20は、通信IF22と、入出力IF23と、メモリ25と、ストレージ26と、プロセッサ29とを備える。入出力IF23は、ユーザからの入力操作を受け付けるための入力装置、及び、ユーザに対して情報を提示するための出力装置のインタフェースとして機能する。
【0030】
生成AI40は、ネットワーク80に接続された1または複数の情報処理装置により実行される人工知能モデルである。生成AI40は、事前に学習したモデルを用いてユーザの入力(プロンプトのテキスト、画像等)に基づき出力を生成する。生成AI40は、例えば、GPT、Claude、LLaMA、BERT、Gemini等が存在する。なお、生成AI40は、テキスト、画像、音声、動画等の複数の種類のデータを一括して処理可能なモデルであってもよい。本開示においては、主に出力情報としてテキスト情報を出力する大規模言語モデルを生成AI40の一種として説明する。また、生成AI40は、サーバ20に組み込まれていてもよい。
【0031】
各情報処理装置は演算装置と記憶装置とを備えたコンピュータにより構成されている。コンピュータの基本ハードウェア構成及び、当該ハードウェア構成により実現されるコンピュータの基本機能構成は後述する。端末装置10、サーバ20、生成AI40のそれぞれについて、後述するコンピュータの基本ハードウェア構成及びコンピュータの基本機能構成と重複する説明は省略する。
【0032】
<端末装置10の構成>
図2は、図1に示す端末装置10の構成例を表すブロック図である。図2に示すように、端末装置10は、通信部120と、入力装置13と、出力装置14と、音声処理部17と、マイク171と、スピーカー172と、記憶部180と、制御部190とを備える。端末装置10に含まれる各ブロックは、例えば、バス等により電気的に接続される。
【0033】
通信部120は、端末装置10が他の装置と通信するための変復調処理等の処理を行う。通信部120は、制御部190で生成された信号に送信処理を施し、外部(例えば、サーバ20)へ送信する。通信部120は、外部から受信した信号に受信処理を施し、制御部190へ出力する。
【0034】
入力装置13は、端末装置10を操作するユーザが指示、又は情報を入力するための装置である。入力装置13は、リーダー、キーボード131、マウス132等により実現される。入力装置13は、操作面へ触れることで指示が入力されるタッチ・センシティブ・デバイス等により実現されてもよい。入力装置13は、ユーザから入力される指示を電気信号へ変換し、電気信号を制御部190へ出力する。なお、入力装置13には、例えば、外部の入力機器から入力される電気信号を受け付ける受信ポートが含まれてもよい。
【0035】
出力装置14は、端末装置10を操作するユーザへ情報を提示するための装置である。出力装置14は、例えば、ディスプレイ141等により実現される。ディスプレイ141は、制御部190の制御に応じたデータを表示する。ディスプレイ141は、例えば、LCD(Liquid Crystal Display)、又は有機EL(Electro-Luminescence)ディスプレイ等によって実現される。
【0036】
音声処理部17は、例えば、音声信号のデジタル-アナログ変換処理を行う。音声処理部17は、マイク171から与えられる信号をデジタル信号に変換して、変換後の信号を制御部190へ与える。また、音声処理部17は、音声信号をスピーカー172へ与える。音声処理部17は、例えば音声処理用のプロセッサによって実現される。マイク171は、音声入力を受け付けて、当該音声入力に対応する音声信号を音声処理部17へ与える。スピーカー172は、音声処理部17から与えられる音声信号を音声に変換して当該音声を端末装置10の外部へ出力する。
【0037】
記憶部180は、例えば、メモリ15、及びストレージ16等により実現され、端末装置10が使用するデータ、及びプログラムを記憶する。記憶部180は、例えば、ユーザ情報181を記憶する。
【0038】
ユーザ情報181は、操作するユーザに関する情報を記憶する。ユーザに関する情報は、例えば、ユーザID、氏名、年齢、住所、生年月日、サービスへの登録年月日等の情報を含む。
【0039】
制御部190は、プロセッサ19が記憶部180に記憶されるプログラムを読み込み、プログラムに含まれる命令を実行することにより実現される。制御部190は、端末装置10の動作を制御する。制御部190は、プログラムに従って動作することにより、操作受付部191、送受信部192、提示制御部193としての機能を発揮する。
【0040】
操作受付部191は、入力装置13から入力される指示、又は情報を受け付けるための処理を行う。例えば、操作受付部191は、入力装置13等から入力される指示または情報を受け付ける。
【0041】
また、操作受付部191は、マイク171から入力される音声情報を受け付ける。具体的には、例えば、操作受付部191は、マイク171から入力され、音声処理部17でデジタルデータに変換された音声データを受信する。
【0042】
送受信部192は、端末装置10が、サーバ20等の外部の装置と、通信プロトコルに従ってデータを送受信するための処理を行う。具体的には、例えば、送受信部192は、ユーザから入力された指示をサーバ20へ送信する。送受信部192は、サーバ20から提供される情報を受信する。
【0043】
提示制御部193は、ユーザに対してサーバ20から提供される情報等の情報を提示するため、出力装置14等を制御する。
【0044】
<サーバ20の機能的な構成>
図3は、サーバ20の機能的な構成の例を示す図である。図3に示すように、サーバ20は、通信部201と、記憶部202と、制御部203としての機能を発揮する。
【0045】
通信部201は、サーバ20が外部の装置と通信するための処理を行う。
【0046】
記憶部202は、例えば、ユーザテーブル2021、児童テーブル2022、画像テーブル2023、書類種別テーブル2024、出力フォーマットテーブル2025、文章テーブル2026、ログ管理テーブル2027、等を有する。
また、記憶部202は、特定の時間帯の始点および終点と、当該時間帯に行われる活動とが対応付けられた時間帯情報(一例として、8:30-9:00:登園、9:00-10:00:朝の会、10:00-11:00:クラス活動、11:00-11:30:昼食準備、11:30-13:00:昼食、13:00-14:30:午睡、14:30-15:00:おやつ、15:00-16:00:外遊び、16:00-:降園)を記憶してもよい。
【0047】
ユーザテーブル2021は、本実施形態に係るサービスに登録するユーザの情報を記憶するテーブルである。本実施形態において、ユーザは、例えば、本実施形態において生成される文章案に係る文章を作成する業務を行う人物であり、一例として保育士である。
【0048】
児童テーブル2022は、児童に関する情報を記憶するテーブルである。
【0049】
画像テーブル2023は、児童に関する画像の情報を記憶するテーブルである。
【0050】
書類種別テーブル2024は、児童福祉施設において作成される書類の種別を管理するテーブルである。
【0051】
出力フォーマットテーブル2025は、児童福祉施設において作成される書類に記載される文章のフォーマットまたは出力例に関する情報を記憶するテーブルである。
【0052】
文章テーブル2026は、児童福祉に関する活動を記録するための書類に記載される文章関する情報を記憶するテーブルである。具体的には、文章テーブル2026は、児童福祉に関する活動を記録するための書類に記載される文章の文章案を生成するために用いられる情報、当該文章案に関する情報、および、当該文章案に基づいて作成された文章に関する情報を記憶する。
【0053】
ログ管理テーブル2027は、児童の状態と、当該状態が観察または記録された時刻(時刻なしの日付であってもよい)が関連付けられた情報であるログ情報を記憶するテーブルである。ログ情報は、例えば以下の情報である。
・児童福祉施設に出席すること(登園、通園、登所、等)に関する情報
・児童福祉施設から帰ること(降園、退園、退所、等)に関する情報
・健康状態(検温、排泄等)に関する情報
・食事に関する情報(食事や水分の摂取量等)
・睡眠(入眠、起床、睡眠状態等)に関する情報
【0054】
記憶部202は、睡眠に関する状態、食事に関する状態等、児童の状態の種別ごとに異なるログ管理テーブル2027を有してもよい。例えば、記憶部202は、児童福祉施設への出席および帰宅に関する情報、睡眠に関する情報、児童の健康状態(検温、排泄等)に関する情報、児童の食事に関する情報等を、それぞれ異なるログ管理テーブル2027において記憶してもよい。
また、1つまたは複数の時間帯と、当該時間帯に関するログ情報を管理するテーブルが関連付けられていてもよい。一例として、「11:30-13:00:昼食」の時間帯に関連付けられた、食事に関するログ情報を管理するログ管理テーブル2027A、「13:00-14:30:午睡」の時間帯に関連付けられた、睡眠に関するログ情報を管理するログ管理テーブル2027B、等が定義されていてもよい。
【0055】
制御部203は、プロセッサ29が記憶部202に記憶されるプログラムを読み込み、プログラムに含まれる命令を実行することにより実現される。制御部203は、プログラムに従って動作することにより、受信制御モジュール2031、送信制御モジュール2032、プロンプト生成モジュール2033、評価モジュール2034、ログ管理モジュール2035、提示モジュール2036、等としての機能を発揮する。
【0056】
受信制御モジュール2031は、サーバ20が外部の装置から通信プロトコルに従って信号を受信する処理を制御する。具体的には、例えば、受信制御モジュール2031は、端末装置10、大規模言語モデルから送信される信号を受信する。
【0057】
送信制御モジュール2032は、サーバ20が外部の装置に対し通信プロトコルに従って信号を送信する処理を制御する。例えば、送信制御モジュール2032は、端末装置10のディスプレイ141に表示する、後述する各種UIに関する情報を端末装置10へ送信する。例えば、送信制御モジュール2032は、プロンプトを含むリクエストを大規模言語モデルへ送信する。
【0058】
プロンプト生成モジュール2033は、大規模言語モデルに入力するためのプロンプトを生成する。プロンプトは、大規模言語モデルから出力データの生成を指示したり、出力データの内容を誘導したりするための入力データである。プロンプトは、テキストデータおよび画像データ(静止画、動画を含む)を含む種々の形式の情報を含みうる。プロンプトに含まれる画像データは、JPEG等の任意の画像形式のデータであってもよいし、テキスト形式等にエンコードされたものであってもよい。プロンプトは、画像データが記憶されている場所のURLやファイルパス等のリンクを含むことにより、大規模言語モデルに画像データを読み込ませる形式であってもよい。
【0059】
図4は、プロンプト生成モジュール2033が生成するプロンプトPの構成の一例を示す図である。プロンプトPは、テキストデータであり、役割指示P1、書類別指示P2、児童情報P3、時間帯指定P4、画像情報P5、出力フォーマットP6、ログ情報P7に例示される各部分のテキストデータを含む。なお、役割指示P1~ログ情報P7が記載される順番は特に限定されない。プロンプトPには、役割指示P1~ログ情報P7のすべてが記載されていなくてもよく、役割指示P1~ログ情報P7以外の文字列が記載されていてもよい。
【0060】
(役割指示P1)
役割指示P1は、大規模言語モデルが文章案を生成する際の役割(立場)を指示する文章を含む。役割指示P1は、例えば、「あなたは優秀な保育士です。」のように、文章を生成する上での大規模言語モデルの立場を指定する文章を含む。
プロンプト生成モジュール2033は、役割指示P1に以下の書類別指示P2~ログ情報P7を結合することにより、プロンプトPを生成する。
【0061】
(書類別指示P2)
書類別指示P2は、文章案を生成する書類の種別を指示する文章を含む。また、書類別指示P2は、書類の種別に応じて異なる、文章案に含めるべき内容に関する指示を含む。例えば、書類の種別が「連絡帳」であった場合、書類別指示P2は、一例として、「保護者とやり取りを行う連絡帳に記載する文章案を作成してください。画像から推定される児童の取り組み、表情、様子、特記事項を下記フォーマットに則って出力してください。」といった文章を含む。
プロンプト生成モジュール2033は、ユーザが指定した書類の種別に応じて異なる指示を含むプロンプトを生成する。例えば、プロンプト生成モジュール2033は、ユーザが指定した書類の種別に基づいて、後述する書類種別テーブル2024を検索し、該当するレコードの項目「書類別指示」のテキストデータを取得し、書類別指示P2として役割指示P1に結合させる。
【0062】
(児童情報P3)
児童情報P3は、文章案の生成対象とする児童等を指定する文章を含む。具体的には、児童情報P3は、児童等を識別可能な情報(児童のID、名前等、または、児童が所属する集団のID、名称等)を含む。
プロンプト生成モジュール2033は、例えば、ユーザが指定した児童等の情報に基づいて後述する児童テーブル2022を検索し、ユーザが指定した児童等の識別情報(児童ID、施設ID、クラスID、班ID等)を特定し、特定した識別情報を含む文章を、児童情報P3として役割指示P1に結合させる。
【0063】
(時間帯指定P4)
時間帯指定P4は、時間帯の指定に関する指示を含む。具体的には、時間帯指定P4は、指定された時間帯についての記載を文章案に含めることに関する指示を含む。また、時間帯指定P4は、複数の時間帯の指定と、指定された時間帯ごとに区切られた文章案を生成することに関する指示を含んでもよい。
【0064】
時間帯指定P4の一例を以下に示す。なお、波括弧で囲まれたフィールドは、プロンプト生成モジュール2033により動的に入力される。
(時間帯指定P4の例)
以下は、施設の1日のスケジュールを時間帯ごとに示したものです。
文章案は、{時間帯1}および{時間帯2}における児童の様子について記載し、時間帯ごとに区切って出力してください。
{時間帯1}は、{画像1}に対応します。{時間帯2}は、{画像2}に対応します。
・8:30-9:00:登園
・9:00-10:00:朝の会
・10:00-11:00:クラス活動
・11:00-11:30:昼食準備(排泄、手洗い、うがい)
・11:30-13:00:昼食
・13:00-14:30:午睡
・14:30-15:00:おやつ
・15:00-16:00:外遊び
・16:00- :降園
【0065】
ユーザが1つまたは複数の画像および1つまたは複数の時間帯を指定した場合、プロンプト生成モジュール2033は、1つまたは複数の時間帯と、1つまたは複数の画像の撮影時刻とを参照して、1つまたは複数の画像のうち、ユーザに指定された時間帯に対応する画像をそれぞれ決定する。例えば、撮影時刻が、ユーザに指定された時間帯に含まれている画像を、ユーザに指定された時間帯に対応する画像としてそれぞれ決定する。
【0066】
なお、ユーザが時間帯を指定することは必須ではない。その場合、プロンプト生成モジュール2033は、記憶部202に記憶される時間帯情報を参照して、すべての時間帯のうち、ユーザが指定した画像の撮影時刻が含まれる時間帯を特定し、画像と時間帯とをそれぞれ対応付けてもよい。
【0067】
そして、プロンプト生成モジュール2033は、大規模言語モデルに対して、各時間帯に対応する画像の状況を読み取ることで、時間帯ごとに区切られた、各時間帯に関する内容の文章を含む文章案を生成する指示を含むテキストを生成し、時間帯指定P4として役割指示P1に結合させる。
【0068】
(画像情報P5)
画像情報P5は、大規模言語モデルが読み取る対象とする画像を指定する文章を含む。例えば、画像情報P5は、任意の形式に変換された画像データや、画像を特定可能な情報(画像の識別情報、画像のURL等)を含む。
プロンプト生成モジュール2033は、例えば、ユーザが指定した画像の情報に基づいて後述する画像テーブル2023を検索し、ユーザが指定した画像の保存先情報を特定し、保存先情報が含まれる文章を、画像情報P5として役割指示P1に結合させる。
【0069】
(出力フォーマットP6)
出力フォーマットP6は、文章案の出力フォーマット(雛形)や、文章案の生成例に関する情報を含む。本実施形態では、出力フォーマットP6の内容は、書類種別に対応する。
プロンプト生成モジュール2033は、ユーザが指定した書類の種別に応じて異なる、文章案の出力形式に関する情報を含むプロンプトを生成する。例えば、プロンプト生成モジュール2033は、ユーザが指定した書類の種別に基づいて、後述する出力フォーマットテーブル2025を検索し、該当するレコードの項目「出力フォーマット」のテキストデータを取得し、出力フォーマットP6として役割指示P1に結合させる。
【0070】
(ログ情報P7)
ログ情報P7は、文章案の生成の際に大規模言語モデルに参照させるログ情報を含む。
プロンプト生成モジュール2033は、例えば、ユーザに指定された児童に関する、ユーザに指定された日付におけるログ情報をログ管理テーブル2027から取得し、ログ情報を参照して文章案を生成する指示とともに、ログ情報P7として役割指示P1に結合させる。
【0071】
プロンプト生成モジュール2033は、画像に対応付けられた時間帯に含まれる時刻において、ユーザが指定した児童について記録されたログ情報をログ管理テーブル2027から抽出し、ログ情報P7に含ませてもよい。そして、ユーザが指定した画像に対する文章案を生成する際に、抽出したログ情報の内容を含める指示を、ログ情報P7に含ませてもよい。
【0072】
または、プロンプト生成モジュール2033は、画像に対応付けられた時間帯に対応する種別のログ管理テーブル2027(一例として、「13:00-14:30:午睡」の時間帯に対応する、睡眠に関するログ情報を管理するログ管理テーブル2027B)における、ユーザが指定した児童のログ情報を抽出し、ログ情報P7に含ませてもよい。そして、ユーザが指定した画像に対する文章案を生成する際に、抽出したログ情報の内容を含める指示を、ログ情報P7に含ませてもよい。
【0073】
以下は、ログ情報P7の一例である。以下の例では、時間帯1として「13:00-14:30:午睡」が指定されており、画像1として、ユーザが指定した児童が寝ている画像が指定されている。
(ログ情報P7の例)
{時間帯1}は、{画像1}に対応するため、{画像1}に対する文章は{時間帯1}に記録されたログ情報の内容も含めてください。
#{時間帯1}ログ情報
13:05: 入眠
13:10: 仰向け
13:15: 覚醒
13:30: 入眠
13:35: 横向き
14:00: 覚醒
【0074】
ログ情報が挿入されたプロンプトを受け付けた大規模言語モデルは、ログ情報を参照することで、画像からは読み取ることができなかった事項を文章案に含めることが可能になる。したがって、児童福祉施設における児童等のより詳細な様子を、文章案として出力することができるようになる。例えば、上記の例では、画像1は児童が寝ている画像であるため、大規模言語モデルは午睡の途中で児童が目覚めたことを画像1から読み取ることができない。一方、大規模言語モデルは、ログ情報を参照することで、児童が午睡の途中で目覚めたことについての文章案を出力することが可能となる。
【0075】
以上のように、プロンプト生成モジュール2033は、役割指示P1~ログ情報P7を結合させることで、プロンプトPを生成する。
【0076】
評価モジュール2034は、評価対象とする児童等に関して大規模言語モデルが生成したテキストデータ(文章案)を分析することにより、児童等の評価を行う。
具体的には、評価モジュール2034は、テキストデータに対して、任意のテキストマイニング手段を用いてテキストマイニングを行うことで、指定された児童等を評価する。
例えば、評価モジュール2034は、テキストデータを、任意の手法によりベクトル化する。そして、評価モジュール2034は、任意の指標(具体的には、児童福祉に関する活動において設けられる児童の資質や成長に関する指標であり、一例として、「健康」「人間関係」「環境」「言葉」「表現」で表される、いわゆる「保育の五領域」の指標)に関連する特徴的な単語を抽出する。評価モジュール2034は、抽出した単語の出現頻度を計数したり、テキストデータ中の当該単語の重要度をTF-IDF等の手法により評価したりすることで、各指標における児童の性質の度合いを評価する。また、評価モジュール2034は、任意の感情分析を利用し、テキストデータ全体のトーンを評価してもよい。
【0077】
なお、評価モジュール2034は、評価の結果として、各指標の評価の度合いの数値を、レーダーチャートやグラフ等の画像によりユーザに提示してもよい。また、評価モジュール2034は、各指標の評価の度合いを、テキストによりユーザに提示してもよい。一例として、文章案のテキストデータから抽出された単語の重要度に基づくテキストを生成し、ユーザに提示してもよい。一例として、「人間関係」に関連付けられた単語の重要度のスコアが高かった場合、評価対象の児童は人間関係に強みがあると判断し、評価結果のコメントのテキストを生成してもよい。
【0078】
また、評価モジュール2034は、テキストデータや、テキストデータをベクトル化等任意の形式に加工したデータを大規模言語モデルに入力することにより、任意の指標に対する児童の評価を、上記と同様に、各指標の評価の度合いを示す数値やテキストとして、大規模言語モデルに出力させてもよい。
【0079】
ログ管理モジュール2035は、ログ情報を記憶部202に記憶する。具体的には、ログ管理モジュール2035は、受信制御モジュール2031が外部の装置から受け付けた、児童の状態に関する情報を、任意の形式に加工し、記憶部202(特に、ログ管理テーブル2027)に記憶する。例えば、ログ管理モジュール2035は、以下のように、ログ情報を記憶部202に記憶する。
・児童の状態を記録するユーザが操作する端末装置から児童の状態に関する情報を受け付け、任意の形式に加工し、ログ情報として記憶部202に記憶する。
・児童の状態を監視する情報処理装置(カメラ、センサ等の任意のデバイス)が、所定のタイミング(ユーザが任意に撮影するタイミング、または、定期的なタイミング)で画像を撮影する。ログ管理モジュール2035は、サーバ20が当該情報処理装置から受け付けた児童の状態に関する情報を任意の形式に加工し、ログ情報として記憶部202に記憶する。
【0080】
提示モジュール2036は、端末装置10の出力装置14に所定の情報を出力させるための制御信号を生成して端末装置10に送信する。特に、提示モジュール2036は、サーバ20が大規模言語モデルから取得した文章案を端末装置10の出力装置14に出力させる。
【0081】
<データ構造>
本実施形態において用いられるデータ構造について説明する。
【0082】
図5は、ユーザテーブル2021のデータ構造を示す図である。ユーザテーブル2021は、ユーザIDを主キーとして、ユーザ名、担当クラス、等のカラムを有するテーブルである。
【0083】
項目「ユーザID」は、ユーザを識別するユーザIDを記憶する項目である。
【0084】
項目「ユーザ名」は、ユーザの名称を記憶する項目である。ユーザ名は、ユーザの氏名、ニックネームなど、任意の文字列を設定してもよい。
【0085】
項目「担当クラス」は、児童福祉施設においてユーザが担当する業務に関する情報を記憶する項目である。具体的には、項目「担当クラス」は、児童福祉施設においてユーザが担当する集団の識別情報を記憶する。
【0086】
図6は、児童テーブル2022のデータ構造を示す図である。児童テーブル2022は、児童IDを主キーとして、名前、施設ID、クラスID、班ID、等のカラムを有するテーブルである。
【0087】
項目「児童ID」は、児童を識別する児童IDを記憶する項目である。
【0088】
項目「名前」は、児童の名前を記憶する項目である。項目「名前」は、児童の氏名など任意の文字列を設定してもよい。
【0089】
項目「施設ID」は、児童が所属する児童福祉施設の識別情報を記憶する項目である。なお、記憶部202には、各施設IDに関連付けられて、施設に関する情報(名称等)が記憶されていてもよい。
【0090】
項目「クラスID」は、児童が所属する児童福祉施設において、児童が所属するクラスの識別情報を記憶する項目である。なお、記憶部202には、各クラスIDに関連付けられて、クラスに関する情報(クラス名、担当保育士等)が記憶されていてもよい。
【0091】
項目「班ID」は、児童が所属する児童福祉施設のクラスにおいて、児童が所属する班の識別情報を記憶する項目である。なお、記憶部202には、各班IDに関連付けられて、班に関する情報(班名等)が記憶されていてもよい。
【0092】
なお、児童福祉施設、クラス、班は、児童が所属する集団の一例である。児童テーブル2022には、児童福祉施設、クラス、班の他に、児童が所属する集団に応じて、任意の集団の識別情報等が記憶されてもよい。
【0093】
図7は、画像テーブル2023のデータ構造を示す図である。画像テーブル2023は、画像IDを主キーとして、保存先、撮影時刻、等のカラムを有するテーブルである。
【0094】
項目「画像ID」は、画像を識別する画像IDを記憶する項目である。
【0095】
項目「保存先」は、画像IDに係る画像の保存先に関する保存先情報を記憶する項目である。保存先情報は、例えば、記憶部202におけるアドレス情報、または画像を参照するためのURL(Uniform Resource Locator)であってもよい。
【0096】
項目「撮影時刻」は、画像IDに係る画像の撮影時刻に関する情報を記憶する項目である。例えば、項目「撮影時刻」は、画像が撮影された時刻のタイムスタンプ情報を記憶する。
【0097】
図8は、書類種別テーブル2024のデータ構造を示す図である。書類種別テーブル2024は、書類種別IDを主キーとして、書類種別、書類別指示、等のカラムを有するテーブルである。
【0098】
項目「書類種別ID」は、書類の種別を識別する書類種別IDを記憶する項目である。
【0099】
項目「書類種別」は、書類種別の名称を記憶する項目である。例えば、項目「書類種別」は、「保育日誌」、「連絡帳」、「おたより」、等の文字列を記憶する。
【0100】
項目「書類別指示」は、大規模言語モデルに入力するプロンプトのうち、書類種別ごとに異なる部分の情報を記憶する項目である。
具体的には、項目「書類別指示」は、書類の種別に応じて異なる、文章案生成の指示に関するテキストデータを記憶する。
例えば、項目「書類別指示」は、文章案の生成対象とする書類種別の指示、書類種別に対応する文章案の構成や文体等の指示に関する文章のテキストデータを記憶する。
【0101】
図9は、出力フォーマットテーブル2025のデータ構造を示す図である。出力フォーマットテーブル2025は、出力フォーマットIDを主キーとして、書類種別ID、出力フォーマット、等のカラムを有するテーブルである。
【0102】
項目「出力フォーマットID」は、出力フォーマットを識別する出力フォーマットIDを記憶する項目である。
【0103】
項目「書類種別ID」は、出力フォーマットIDに対応する書類種別の書類種別IDを記憶する項目である。
【0104】
項目「出力フォーマット」は、文章案を生成する際のフォーマット(雛形)に関する情報を記憶する項目である。
具体的には、項目「出力フォーマット」は、文章案を一定の形に整えるための規則や記述形式に関する情報を記憶する。
例えば、項目「出力フォーマット」は、動的な箇所を空白のフィールドで示したテキストデータを記憶する。テキストデータの一例を以下に示す。なお、波括弧で囲まれたフィールドは、プロンプト生成モジュール2033により動的に入力される。また、角括弧で囲まれるフィールドは、大規模言語モデルにより入力される。
(出力フォーマット)
今日の{児童等}さんは、[本日の取り組み内容を記載]。
[取り組み内容]に対して[取り組み内容に対する様子を記載]でした。
また、[特記事項]。
【0105】
なお、項目「出力フォーマット」は、具体的な例文のテキストデータを記憶してもよいし、文章案に記載すべき内容を箇条書き等で指示したテキストデータを記憶してもよい。
【0106】
図10は、文章テーブル2026のデータ構造を示す図である。文章テーブル2026は、文章IDを主キーとして、ユーザID、児童ID、書類種別ID、作成時刻、画像ID、プロンプト、文章案、確定文章、等のカラムを有するテーブルである。
【0107】
項目「文章ID」は、文章を識別する文章IDを記憶する項目である。
【0108】
項目「ユーザID」は、ユーザを識別するユーザIDを記憶する項目である。
【0109】
項目「児童ID」は、児童を識別する児童IDを記憶する項目である。なお、文章テーブル2026は、児童IDに加えて、集団の識別情報(施設ID、クラスID、班ID等)が記憶されていてもよい。これにより、所定の児童について生成された文章に加え、所定の集団について生成された文章に関する情報を記憶することができる。
【0110】
項目「書類種別ID」は、書類種別を識別する書類種別IDを記憶する項目である。
【0111】
項目「作成時刻」は、文章IDに係る文章が作成された時刻を記憶する項目である。具体的には、例えば、項目「作成時刻」は、文章の内容が確定した時刻を記憶する。
【0112】
項目「画像ID」は、画像を識別する画像IDを記憶する項目である。
【0113】
項目「文章案」は、文章IDに係る文章について、後述する文章案生成処理において大規模言語モデルにより生成された文章案のテキストデータを記憶する項目である。
【0114】
項目「プロンプト」は、後述する文章案生成処理において、項目「文章案」に記憶される文章案を大規模言語モデルに生成させる際に用いたプロンプトのテキストデータを記憶する項目である。
【0115】
項目「確定文章」は、文章IDに係る文章について、ユーザにより内容が確定された確定文章のテキストデータを記憶する項目である。具体的には、例えば、項目「確定文章」は、項目「文章案」のテキストデータをユーザが確認し、適宜修正を行った後に内容を確定させた文章のテキストデータを記憶する。
【0116】
図11は、ログ管理テーブル2027のデータ構造を示す図である。ログ管理テーブル2027は、ログIDを主キーとして、児童ID、時刻情報、ログ情報、等のカラムを有するテーブルである。
【0117】
項目「ログID」は、ログ情報を識別するログIDを記憶する項目である。
【0118】
項目「児童ID」は、児童を識別する児童IDを記憶する項目である。なおログ管理テーブル2027は、児童IDに加えて、集団の識別情報(施設ID、クラスID、班ID等)が記憶されていてもよい。これにより、所定の児童に係るログ情報に加え、所定の集団に係るログ情報を記憶することができる。
【0119】
項目「時刻情報」は、ログが記録された時刻に関する情報を記憶する項目である。具体的には、例えば、項目「時刻情報」は、ログが記録された際のタイムスタンプ情報を記憶する。
【0120】
項目「ログ情報」は、項目「時刻情報」の時刻に記録された、児童の状態の記録に関するログ情報を記憶する項目である。
具体的には、項目「ログ情報」は、児童の状態を示す識別情報や文字列等を記憶する。
例えば、項目「ログ情報」は、ログ情報として、児童の睡眠の状態に関する情報を記憶する場合は、一例として、「入眠」や「仰向け」等、睡眠に関する児童の状態を識別可能な文字列を記憶する。
【0121】
<動作>
(文章案生成処理)
本実施形態のシステム1の動作について説明する。図12は、本実施形態の文章案生成処理のフローチャートである。
【0122】
まず、端末装置10は、文章案を生成するためのアプリケーションを実行する。なお、書類の作成は、ウェブブラウザを介して実行されてもよい。例えば、ユーザは、端末装置10を操作し、文章案を生成するためのアプリケーションを選択し、端末装置10に実行させる。端末装置10がアプリケーションを実行すると、制御部190は、ユーザを認証するためのログイン画面をディスプレイ141に表示させる。
【0123】
ユーザは、ログイン画面において、例えば、ログインID及びパスワードを入力する。制御部190は、ユーザの認証が完了すると、ユーザIDと関連付けてサーバ20にアクセスする。
【0124】
サーバ20は、端末装置10のアクセスを受け付けると、児童テーブル2022に記憶される児童等の情報、書類種別テーブル2024に記憶される書類種別の情報等に基づき、文章案を生成するために必要な情報を入力するための入力UIを生成し、端末装置10を介してユーザに提示する。例えば、サーバ20は、情報の入力画面を端末装置10のディスプレイ141に表示させる。
【0125】
ステップS11において、端末装置10は、文章案を生成するための情報の入力画面D1をディスプレイ141に表示する。図13は、入力画面D1の例を示す模式図である。入力画面D1は、操作オブジェクトD11、D12、D13、D14、D15、D16を含む。
【0126】
操作オブジェクトD11は、文章案の生成対象とする日付を指定する操作を受け付ける。例えば、操作オブジェクトD11への操作を受け付けると、端末装置10は、日付の一覧を選択可能に表示する。そして、端末装置10は、日付の指定をユーザから受け付ける。
【0127】
操作オブジェクトD12は、書類の種別を指定する操作を受け付ける。例えば、操作オブジェクトD12への操作を受け付けると、端末装置10は、サーバ20から受け付けた書類種別の一覧を選択可能に表示する。そして、端末装置10は、書類種別の指定をユーザから受け付ける。
【0128】
操作オブジェクトD13は、文章案の生成対象とする児童を指定する操作を受け付ける。例えば、操作オブジェクトD13への操作を受け付けると、端末装置10は、サーバ20から受け付けた児童の一覧を選択可能に表示する。そして、端末装置10は、児童の指定をユーザから受け付ける。なお、操作オブジェクトD13は、入力フォームに対する自由入力により児童を指定可能なオブジェクトであってもよい。
【0129】
また、操作オブジェクトD13は、児童を指定可能なことに加えて、または代えて、集団(施設、クラス、班等)を指定可能であってもよい。例えば、操作オブジェクトD13は、ユーザからの操作を受け付けると、サーバ20から受け付けた、集団の一覧を選択可能に表示し、文章案の生成対象とする集団の指定を受け付けてもよい。
【0130】
操作オブジェクトD14は、文章案の生成対象とする時間帯を指定する操作を受け付ける。
例えば、操作オブジェクトD14への操作を受け付けると、端末装置10は、時間帯情報を参照して、時間帯の一覧をユーザから選択可能にディスプレイ141に表示する。
【0131】
端末装置10は、文章案の生成対象とする1つまたは複数の時間帯の指定をユーザから受け付ける。なお、ユーザは、時間帯の指定を行わなくてもよい。
【0132】
操作オブジェクトD15は、文章案の生成対象とする画像を指定する操作を受け付ける。例えば、操作オブジェクトD15への操作を受け付けると、端末装置10は、サーバ20の記憶部202等に設けられた、画像が保存されているデータベースにアクセスし、児童福祉に関する活動の様子が記録された画像の一覧をディスプレイ141に表示する。そして、端末装置10は、文章案の生成対象とする1つまたは複数の画像の指定をユーザから受け付ける。なお、指定される画像は、操作オブジェクトD13において指定される児童が映っていなくてもよい(例えば、プール、木など、人物が映っていない画像であってもよい)。
【0133】
操作オブジェクトD16は、文章案を生成する指示を入力するための操作を受け付ける。例えば、端末装置10は、操作オブジェクトD16への操作を受け付けると、端末装置10は、文章案を生成する旨の指示を、入力画面D1において操作オブジェクトD11~D15に入力された操作に基づく各情報とともに、サーバ20へ送信する。端末装置10がサーバ20へ送信する情報は、例えば、以下の情報を含む。
・ユーザから指定された日付に関する日付情報
・ユーザから指定された書類種別の識別情報(一例として書類種別ID)
・ユーザから指定された児童等の識別情報(一例として児童ID、施設ID、クラスID、班ID)
・ユーザから指定された時間帯を特定可能な情報(一例として、時間帯の始点及び終点を特定可能な文字列)
・ユーザから指定された画像の識別情報(一例として画像ID)
【0134】
以下の説明では、一例として、児童等の指定として所定の児童が指定された場合について説明する。なお、児童以外の所定の集団が指定された場合は、以下の説明において、「児童」を「集団」に適宜読み替えればよい。
【0135】
ステップS12において、サーバ20は、ユーザから日付の指定を受け付ける。具体的には、例えば、20は、端末装置10から送信された日付情報を受け付ける。
【0136】
また、サーバ20は、書類の種別の指定を受け付ける。具体的には、例えば、サーバ20は、端末装置10から送信された書類種別IDを受け付ける。
【0137】
また、サーバ20は、ユーザから、文章案の生成対象として、児童等の指定を受け付ける。具体的には、例えば、サーバ20は、端末装置10から送信された児童IDを受け付ける。
【0138】
また、サーバ20は、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童等が関連する画像として特定する。具体的には、例えば、サーバ20は、端末装置10から送信された画像IDに基づいて画像テーブル2023を検索することにより、ユーザから指定された画像を、生成対象として指定された児童等が関連する画像として特定する。サーバ20は、特定した画像の項目「保存先」、「撮影時刻」の情報を取得する。
【0139】
また、サーバ20は、ユーザから、1または複数の時間帯の指定を受け付ける。具体的には、例えば、サーバ20は、端末装置10から送信された時間帯を特定可能な情報を受け付ける。
【0140】
また、サーバ20は、ユーザに指定された時間帯と、特定した画像に関連付けられた時刻情報とに基づいて、ユーザに指定された時間帯に対応する画像を決定する。
例えば、サーバ20は、撮影時刻が、ユーザに指定された時間帯に含まれている画像を、ユーザに指定された時間帯に対応する画像としてそれぞれ決定する。
なお、ユーザが端末装置10を操作することにより、ユーザが指定した複数の画像のうちユーザが指定した時間帯と対応する画像をそれぞれ指定してもよい。
【0141】
ステップS13において、書類種別に応じて異なる、大規模言語モデルに対する指示に関する情報を取得する。
具体的には、例えば、サーバ20は、ステップS12において受け付けた書類種別IDに基づいて書類種別テーブル2024を検索し、該当するレコードの項目「書類別指示」に記憶されるテキストデータを取得する。
【0142】
また、サーバ20は、文章案の出力形式に関する情報を取得する。
具体的には、例えば、サーバ20は、ステップS12において受け付けた書類種別IDに基づいて出力フォーマットテーブル2025を検索し、該当するレコードの項目「出力フォーマット」に記憶されるテキストデータを取得する。
【0143】
また、サーバ20は、ユーザに指定された児童に関する情報を取得する。
具体的には、例えば、サーバ20は、ステップS12において受け付けた児童IDに基づいて児童テーブル2022を検索し、項目「名前」に記憶される情報を取得する。
【0144】
また、サーバ20は、ユーザに指定された児童についてログ情報を取得する。
具体的には、例えば、サーバ20は、日付情報および児童IDを受け付けると、日付情報に係る日付、および、児童IDに基づいてログ管理テーブル2027を検索し、該当するレコードを抽出する。この際、ログ管理テーブル2027がログ情報の種別に応じて複数存在する場合、すべての種別のログ管理テーブル2027においてレコードの抽出を行ってもよいし、ユーザによるログ情報の種別の指定等に基づいて、任意の種別のログ管理テーブル2027においてレコードの抽出を行ってもよい。
【0145】
ステップS14において、サーバ20は、ステップS12で特定した画像の状況を読み取ることとと、、読み取った状況に基づいて、生成対象として指定された児童等に関する文章案を生成することとを含むプロンプトを生成する。具体的には、例えば、サーバ20は、ステップS12およびステップS13において取得した情報に基づいて、大規模言語モデルに入力すべきプロンプトを生成する。
また、サーバ20は、ステップS12で特定した画像から、生成した文章案に対して適切な添付画像を選択し、提示する指示を、プロンプトに含ませてもよい。
【0146】
ステップS15において、サーバ20は、ステップS12において決定した画像に関する情報を含むプロンプトを大規模言語モデルへ入力する。具体的には、例えば、サーバ20は、ステップS12において決定した画像データまたは大規模言語モデルが画像にアクセスするための情報を含むプロンプトを大規模言語モデルのAPIに送信する。大規模言語モデルは、受信したプロンプトに基づいて、文章案を含む応答を生成し、応答をサーバ20へ送信する。
【0147】
ステップS16において、サーバ20は、大規模言語モデルからプロンプトに対する応答を取得し、応答に含まれる文章案を取得する。また、サーバ20は、応答に含まれる、文章案に対する添付画像に関する情報(例えば、保存先情報)を取得する。
【0148】
ステップS17において、サーバ20は、ステップS16で抽出した文章案を表示するための表示UIを生成し、端末装置10を介してユーザに提示する。具体的には、例えば、サーバ20は、文章案の表示画面を端末装置10のディスプレイ141に表示させる。
【0149】
ステップS18において、端末装置10は、文章案を表示する文章案表示画面D2をディスプレイ141に表示することで、文章案をユーザに提示する。
【0150】
図14は、文章案表示画面D2の例を示す模式図である。文章案表示画面D2は、表示オブジェクトD21、表示オブジェクトD22、表示オブジェクトD23、操作オブジェクトD24、操作オブジェクトD25を含む。
【0151】
表示オブジェクトD21は、生成対象となっている文章案および書類に関する情報を表示する。例えば、表示オブジェクトD21は、ステップS12においてサーバ20が指定を受け付けた児童の名前、日付等を表示する。また、表示オブジェクトD21は、ステップS13においてサーバ20が取得したログ情報に基づいて、児童の睡眠、食事、排泄等の状態と、その状態が記録された時刻とを関連付けて表示することとしてもよい。
【0152】
表示オブジェクトD22は、プロンプトの入力に応じて大規模言語モデルが出力した文章案を表示するオブジェクトである。
【0153】
表示オブジェクトD23は、プロンプトの入力に応じて大規模言語モデルが出力した、文章案に対する添付画像を表示する。
【0154】
操作オブジェクトD24は、表示オブジェクトD22に表示される文章案の修正を要求する操作を受け付ける。例えば、操作オブジェクトD24への操作を受け付けると、端末装置10は、表示オブジェクトD22に表示される文章案のテキストを編集可能とする。ユーザは、入力装置13を操作して、表示オブジェクトD22に表示される文章案のテキストを編集する。なお、操作オブジェクトD24への操作によらず、表示オブジェクトD22に表示される文章案の編集が可能であってもよい。
【0155】
操作オブジェクトD25は、文章の内容を確定するための操作を受け付ける。例えば、操作オブジェクトD25への操作を受け付けると、当該操作を受け付けた際に表示オブジェクトD22に表示されている文章案を正式な確定文章として確定し、確定文章のテキストデータをサーバ20へ送信する。
【0156】
ステップS19において、サーバ20は、端末装置10から送信された確定文章のテキストデータを受け付ける。サーバ20は、ユーザのユーザID、ステップS12でユーザから指定を受け付けた児童の児童ID、ステップS12でユーザから指定を受け付けた書類種別の書類種別ID、ステップS12で特定した画像の画像ID、ステップS14で生成したプロンプトのテキストデータ、ステップS16で取得した文章案のテキストデータ、確定文章のテキストデータ、レコードの作成時刻を、それぞれ、文章テーブル2026の新たなレコードの文章ID、ユーザID、児童ID、書類種別ID、画像ID、プロンプト、文章案、確定文章、作成時刻の項目に記憶する。
【0157】
サーバ20は、確定文章のテキストデータ、文章案表示画面D2の表示オブジェクトD21において表示させた情報、表示オブジェクトD23において表示させた添付画像を含む、ステップS12で指定を受け付けた書類種別の書類データを作成し、記憶部202に記憶する。サーバ20は、作成した書類データを、予め定められた任意の送信先(例えば、児童IDにより特定される児童に関連付けられた連絡先)へ送信することとしてもよい。
【0158】
(児童評価処理)
図15は、本実施形態の評価処理のフローチャートである。
【0159】
まず、端末装置10は、児童等を評価するためのアプリケーションを実行する。なお、児童の評価は、ウェブブラウザを介して実行されてもよい。例えば、ユーザは、端末装置10を操作し、児童等を評価するためのアプリケーションを選択し、端末装置10に実行させる。端末装置10がアプリケーションを実行すると、制御部190は、ユーザを認証するためのログイン画面をディスプレイ141に表示させる。
【0160】
ユーザは、ログイン画面において、例えば、ログインID及びパスワードを入力する。制御部190は、ユーザの認証が完了すると、ユーザIDと関連付けてサーバ20にアクセスする。
【0161】
サーバ20は、端末装置10のアクセスを受け付けると、児童等を評価するために必要な情報を入力するための入力UIを生成し、端末装置10を介してユーザに提示する。例えば、サーバ20は、児童等を評価するための条件を設定する画面を端末装置10のディスプレイ141に表示させる。
【0162】
ステップS21において、端末装置10は、児童等を評価するための設定画面である条件設定画面D3をディスプレイ141に表示する。図16は、条件設定画面D3の例を示す模式図である。操作オブジェクトD31、操作オブジェクトD32、操作オブジェクトD33、操作オブジェクトD34を含む。
【0163】
操作オブジェクトD31は、評価の対象とする児童等を指定する操作を受け付ける。例えば、操作オブジェクトD31への操作を受け付けると、端末装置10は、サーバ20から受け付けた児童等の一覧を選択可能に表示する。そして、端末装置10は、児童等の指定をユーザから受け付ける。なお、操作オブジェクトD31は、入力フォームに対する自由入力により児童等を指定可能なオブジェクトであってもよい。
【0164】
なお、本実施形態では、児童等の指定として、所定の児童が指定された場合について説明する。児童以外の所定の集団が指定された場合は、以下の説明において、「児童」を「集団」に適宜読み替えればよい。
【0165】
操作オブジェクトD32は、文章の分析対象とする書類種別を指定する操作を受け付ける。例えば、操作オブジェクトD32への操作を受け付けると、端末装置10は、サーバ20から受け付けた書類種別の一覧を選択可能に表示する。そして、端末装置10は、1または複数の書類種別の指定をユーザから受け付ける。
【0166】
操作オブジェクトD33は、文章の検索対象とする期間を指定する操作を受け付ける。例えば、操作オブジェクトD33への操作を受け付けると、端末装置10は、日付の一覧を、期間の始点と終点とを選択可能に表示する。そして、端末装置10は、期間の始点の日付と終点の日付との指定を受け付けることにより、期間の指定を受け付ける。
【0167】
操作オブジェクトD34は、児童を評価する指示を入力するための操作を受け付ける。例えば、端末装置10は、操作オブジェクトD34への操作を受け付けると、条件設定画面D3において操作オブジェクトD31~操作オブジェクトD33に入力された操作に基づく各情報とともに、児童を評価する指示をサーバ20へ送信する。端末装置10がサーバ20へ送信する情報は、例えば、以下の情報を含む。
・ユーザから指定された児童等の識別情報(一例として児童ID、施設ID、クラスID、班ID)
・ユーザから指定された書類種別の識別情報(一例として書類種別ID)
・ユーザから指定された期間に関する期間情報(一例として始点の日付および終点の日付の情報)
【0168】
ステップS22において、サーバ20は、ユーザから、評価対象として、児童等の指定を受け付ける。具体的には、例えば、サーバ20は、端末装置10から送信された児童IDを受け付ける。
【0169】
また、サーバ20は、書類種別の指定、期間の指定を受け付ける。具体的には、例えば、サーバ20は、端末装置10から送信された書類種別ID、期間情報を受け付ける。
【0170】
また、サーバ20は、データベースに記憶される文章案から、評価対象として指定された児童等に関連付けられた文章案を抽出する。具体的には、例えば、サーバ20は、端末装置10から受け付けた児童ID、書類種別ID、および期間情報に基づいて、文章テーブル2026の項目「児童ID」「書類種別ID」「作成時刻」を検索し、該当するレコードの項目「文章案」に記憶される情報を取得する。なお、この情報は、文章案生成処理のステップS19においてサーバ20が記憶した情報である。これにより、指定された期間の始点から終点までの期間に、指定された児童に関して大規模言語モデルにより生成された、指定された書類種別に関する文章案を取得することができる。
【0171】
ステップS23において、サーバ20は、抽出された文章案のテキストデータを分析することにより、評価対象として指定された児童等を評価する。
【0172】
ステップS24において、サーバ20は、分析結果を表示するための結果表示UIを生成し、端末装置10を介してユーザに提示する。
具体的には、例えば、サーバ20は、分析結果の表示画面を端末装置10のディスプレイ141に表示させる。
【0173】
ステップS25において、端末装置10は、分析結果を表示する結果表示画面D4をディスプレイ141に表示することで、分析結果をユーザに提示する。
【0174】
図17は、結果表示画面D4の例を示す模式図である。結果表示画面D4は、表示オブジェクトD41を含む。
【0175】
表示オブジェクトD41は、ステップS23でサーバ20が出力した評価結果を表示する。具体的には、例えば、表示オブジェクトD41は、ステップS23で数値化された各指標に対する評価の度合いをそれぞれ比較可能に表示する。一例として、表示オブジェクトD41は、図17に示すように、各指標の評価の度合いをレーダーチャートで表示する。また、表示オブジェクトD41は、児童の評価結果に関するコメントを示すテキストを表示する。
【0176】
<変形例>
上記の文章案生成処理および児童評価処理の各ステップは、端末装置10およびサーバ20の何れでも実行可能である。
上記説明では、各処理において各ステップを特定の順序で実行する例を示したが、各ステップの実行順序は、依存関係がない限りは説明した例に制限されない。
【0177】
上記の実施形態では、出力フォーマットテーブル2025において、1つの書類種別に対し1つの出力フォーマットが設定されていた。しかしながら、1つの書類種別に対して複数の出力フォーマットが設定されていてもよい。この場合、ステップS11およびステップS12においてユーザからの出力フォーマットの指定を受け付け、当該指定に基づいて出力フォーマットP6を生成してもよい。
【0178】
上記の実施形態では、ステップS12において、サーバ20は、画像の指定と児童の指定とを受け付けていた。しかしながら、サーバ20は、画像または児童のいずれかの指定のみを受け付けてもよい。画像のみの指定を受け付けた場合、サーバ20は、任意の顔認識技術により、画像に含まれる児童の顔から児童を特定し、特定した児童をユーザが指定したものとしてもよい。児童のみの指定を受け付けた場合、サーバ20は、ユーザが指定した日付に撮影された画像のうち、任意の顔認識技術により当該児童の識別情報が付与された画像をユーザがすべて指定したものとしてもよい。
【0179】
上記の実施形態では、ステップS12において、サーバ20は、ユーザから時間帯の指定を受け付けていた。しかしながら、サーバ20は、時間帯に代えて、または加えて、時刻の指定を受け付けてもよい。その場合、サーバ20は、撮影時刻が、指定された時刻の前後に所定の時間範囲内に含まれる画像を、指定された時刻に対応する画像として決定してもよい。また、サーバ20は、記録された時刻が、指定された時刻の前後に所定の時間範囲内に含まれるログ情報を参照して、指定された時刻における児童の状態に関する文章を生成する指示として、プロンプトPのログ情報P7に含ませてもよい。
【0180】
上記の実施形態では、ステップS12において、サーバ20は、ユーザから時間帯の指定を受け付けていた。しかしながら、サーバ20は、時間帯に代えて、または加えて、1つまたは複数の場面の指定を受け付けてもよい。場面とは、登園、朝の会、クラス活動等の、児童福祉に関する活動における任意の場面を指す。そして、サーバ20は、ユーザが指定した児童等が関連する画像から、ユーザから指定された場面に対応する画像を決定することと、当該場面に対応する画像の状況を読み取ることで、当該場面に関する文章を含む文章案を生成する指示を生成し、プロンプトPの一部として構成させてもよい。
または、サーバ20は、任意の画像認識技術により、ユーザが指定した児童等が関連する画像のうち、特定の画像を、ユーザが指定した場面を記録した画像と対応付けてもよい。そして、サーバ20は、当該特定の画像を参照して、ユーザが指定した場面に関する内容の文章を含む文章案を生成する指示を生成し、プロンプトPの一部として構成させてもよい。
【0181】
上記の実施形態では、サーバ20のプロンプト生成モジュール2033は、ログ情報が挿入されたプロンプトを生成していた。しかしながら、サーバ20は、画像を読み取る指示を含むプロンプトを大規模言語モデルに入力した後に、大規模言語モデルから、必要なログ情報の要求を受け付けてもよい。そして、サーバ20は、大規模言語モデルの要求に応じてログ管理テーブル2027からログ情報を抽出し、大規模言語モデルに提供してもよい。
【0182】
具体的には、まず、サーバ20は、上記の実施形態と同様に、特定の画像に基づいて、児童に関する文章案を生成する指示を含むプロンプトを生成し、大規模言語モデルに入力する。その際、例えば、サーバ20は、大規模言語モデルがサーバ20に対し呼び出し可能な、ログ管理テーブル2027を検索するための関数に関する情報を、大規模言語モデルに入力する。
【0183】
大規模言語モデルは、入力されたプロンプトに基づき画像の内容を読み取り、サーバ20へ要求すべきログ情報を判断し、サーバ20へ要求する。
一例として、大規模言語モデルは、入力された画像が、寝ている児童を記録した画像であると読み取った場合、睡眠に関するログ情報をサーバ20へ要求すると判断する。そして、大規模言語モデルは、プロンプトにおいて指定された児童について、睡眠に関するログ情報を取得する関数を呼び出すようにサーバ20へ要求する。
【0184】
サーバ20は、大規模言語モデルから受け取った要求に基づいてログ管理テーブル2027を検索し、必要なログ情報を大規模言語モデルへ提供する。
一例として、サーバ20は、大規模言語モデルから受け取った関数を実行することで、プロンプトにおいて指定した児童の児童IDに基づいて、睡眠に関するログ情報を記憶するログ管理テーブル2027Bを検索し、該当するログ情報を抽出し、大規模言語モデルへ提供する。
【0185】
大規模言語モデルは、受け取ったログ情報の内容を参照しつつ、プロンプトにおいて入力された画像に関する文章案を出力する。これにより、大規模言語モデルは、ログ情報を参照することで、画像からは読み取ることができなかった事項を文章案に含めることが可能になる。したがって、児童福祉施設における児童等のより詳細な様子を、文章案として出力することができるようになる。
【0186】
<小括>
【0187】
以上説明したように、サーバ20は、第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付け、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童または集団が関連する画像として特定する。サーバ20は、特定された画像の状況を読み取る指示と、読み取った状況に基づいて、生成対象として指定された児童または集団に関する文章案を生成する指示とを含む指示を含むプロンプトを生成する。サーバ20は、画像に関する情報を含むプロンプトを大規模言語モデルに入力することで、大規模言語モデルから文章案を取得し、第1のユーザに提示する。これにより、ユーザは、大規模言語モデルから出力された文章案を参照して、書類に記載する文章を作成することが可能となる。したがって、書類に記載する文章の作成を効率化することができる。
【0188】
また、文章案は、児童福祉に関する活動を記録するための書類に記載する文章の案である。これにより、児童福祉に関する活動を記録するための書類に記載する文章の作成を効率化することができる。
【0189】
また、サーバ20は、書類の種別の指定を受け付け、指定された種別に応じて異なる指示を含むプロンプトを生成する。これにより、ユーザから指定された書類の種別に応じて異なる文章案を提示することができる。
【0190】
また、サーバ20は、指定された種別に応じて異なる、文章案の出力形式に関する情報を含むプロンプトを生成する。これにより、ユーザから指定された書類の種別に応じて、異なる出力形式の文章案を提示することができる。
【0191】
また、サーバ20は、1または複数の時間帯の指定を受け付け、指定された時間帯と特定された画像に関連付けられた時刻情報とに基づいて、時間帯に対応する画像を決定する。サーバ20は、時間帯に対応する画像の状況を読み取ることで、時間帯に関する文章を含む文章案を生成する指示を含むプロンプトを生成する。これにより、ユーザに指定された時間帯に応じた文章案を提示することができる。
【0192】
また、サーバ20は、児童等が関連する画像として複数の画像を特定し、複数の時間帯の指定を受け付け、指定された複数の時間帯にそれぞれ対応する複数の画像を決定する。サーバ20は、複数の時間帯に対応する複数の画像の状況をそれぞれ読み取ることで、複数の時間帯ごとに区切られた文章を生成する指示を含むプロンプトを生成する。これにより、複数の時間帯ごとに区分された文章案をユーザに提示することができ、ユーザは、時間帯ごとの児童等の様子がわかりやすい文章を作成することができる。
【0193】
また、サーバ20は、1つまたは複数の場面の指定を受け付け、児童等が関連する画像として特定された画像から場面に対応する画像を決定し、場面に対応する画像の状況を読み取ることと、場面に関する文章を含む文章案を生成することとを含むプロンプトを生成する。これにより、ユーザに指定された場面に応じた文章案を提示することができる。
【0194】
また、サーバ20は、指定された児童等の状態に関する情報と時刻情報とが関連付けて記録されたログ情報を取得し、ログ情報を参照して文章案を生成する指示を含むプロンプトを生成する。これにより、画像以外の情報を大規模言語モデルに参照させることで、児童の状態についてより詳細に言及した文章案を提示することができる。
【0195】
また、サーバ20は、1または複数の時間帯の指定を受け付け、指定された時間帯とログ情報に含まれる時刻情報とを参照して、時間帯に対応する児童の状態に関する文章を含む文章案を生成する指示を含むプロンプトを生成する。これにより、ユーザが指定した時間帯において、児童の状態についてより詳細に言及した文章案を提示することができる。
【0196】
また、サーバ20は、児童等に関する画像として特定された画像から、生成した文章案に対する添付画像を選択する指示を含むプロンプトを生成する。サーバ20は、大規模言語モデルから、添付画像に関する情報を取得し、ユーザに添付画像を提示する。これにより、ユーザが自身で画像を選択する手間が削減され、書類作成を効率化することができる。
【0197】
また、サーバ20は、大規模言語モデルから取得した文章案を、生成対象として指定された児童または集団に関連付けてデータベースに記憶する。サーバ20は、ユーザから、評価対象として、児童等の指定を受け付ける。サーバ20は、データベースに記憶される1または複数の文章案から、評価対象として指定された児童等に関連付けられた文章案を抽出する。サーバ20は、抽出された文章案のテキストデータを分析することにより、評価対象として指定された児童または児童が所属する集団を評価し、評価の結果をユーザに提示する。また、サーバ20は、抽出された文章案のテキストデータに対してテキストマイニングを行い、抽出された文章案の特徴を抽出することにより、評価対象として指定された児童等を評価する。これにより、サーバ20が生成した文章案に基づいて、児童を評価することができる。文章案は、児童の児童福祉施設における様子を撮影した画像であるので、児童福祉施設における児童の状態や行動を、適切に評価することができる。さらに、文章案は、大規模言語モデルが画像の様子を読み取って客観的に出力したものであり、保育士等により作成や修正等が行われた文章ではない。そのため、文章案には、児童に対する保育士等の主観的な目線が入っていない。したがって、当該文章案のテキストデータの分析により、保育士等が主観的に評価するよりも、客観的な評価を行うことができる。
【0198】
<4 コンピュータの基本ハードウェア構成>
図18は、コンピュータ90の基本的なハードウェア構成を示すブロック図である。コンピュータ90は、プロセッサ94、主記憶装置95、補助記憶装置96、通信IF99(インタフェース、Interface)を少なくとも備える。これらはバスにより相互に電気的に接続される。
【0199】
プロセッサ94とは、プログラムに記述された命令セットを実行するためのハードウェアである。プロセッサ94は、演算装置、レジスタ、周辺回路等から構成される。
【0200】
主記憶装置95とは、プログラム、及びプログラム等で処理されるデータ等を一時的に記憶するためのものである。例えば、DRAM(Dynamic Random Access Memory)等の揮発性のメモリである。
【0201】
補助記憶装置96とは、データ及びプログラムを保存するための記憶装置である。例えば、フラッシュメモリ、HDD(Hard Disc Drive)、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等である。
【0202】
通信IF99とは、有線又は無線の通信規格を用いて、他のコンピュータとネットワークを介して通信するための信号を入出力するためのインタフェースである。
【0203】
ネットワークは、インターネット、LAN、無線基地局等によって構築される各種移動通信システム等で構成される。例えば、ネットワークには、3G、4G、5G移動通信システム、LTE(Long Term Evolution)、所定のアクセスポイントによってインターネットに接続可能な無線ネットワーク(例えば、Wi-Fi(登録商標))等が含まれる。無線で接続する場合、通信プロトコルとして例えば、Z-Wave(登録商標)、ZigBee(登録商標)、Bluetooth(登録商標)等が含まれる。有線で接続する場合は、ネットワークには、USB(Universal Serial Bus)ケーブル等により直接接続するものも含む。
【0204】
なお、各ハードウェア構成の全部または一部を複数のコンピュータ90に分散して設け、ネットワークを介して相互に接続することによりコンピュータ90を仮想的に実現することができる。このように、コンピュータ90は、単一の筐体、ケースに収納されたコンピュータ90だけでなく、仮想化されたコンピュータシステムも含む概念である。
【0205】
<コンピュータ90の基本機能構成>
図18に示すコンピュータ90の基本ハードウェア構成により実現されるコンピュータの機能構成を説明する。コンピュータは、制御部、記憶部、通信部の機能ユニットを少なくとも備える。
【0206】
なお、コンピュータ90が備える機能ユニットは、それぞれの機能ユニットの全部または一部を、ネットワークで相互に接続された複数のコンピュータ90に分散して設けても実現することができる。コンピュータ90は、単一のコンピュータ90だけでなく、仮想化されたコンピュータシステムも含む概念である。
【0207】
制御部は、プロセッサ94が補助記憶装置96に記憶された各種プログラムを読み出して主記憶装置95に展開し、当該プログラムに従って処理を実行することにより実現される。制御部は、プログラムの種類に応じて様々な情報処理を行う機能ユニットを実現することができる。これにより、コンピュータは情報処理を行う情報処理装置として実現される。
【0208】
記憶部は、主記憶装置95、補助記憶装置96により実現される。記憶部は、データ、各種プログラム、各種データベースを記憶する。また、プロセッサ94は、プログラムに従って記憶部に対応する記憶領域を主記憶装置95または補助記憶装置96に確保することができる。また、制御部は、各種プログラムに従ってプロセッサ94に、記憶部に記憶されたデータの追加、更新、削除処理を実行させることができる。
【0209】
データベースは、リレーショナルデータベースを指し、行と列によって構造的に規定された表形式のテーブルと呼ばれるデータ集合を、互いに関連づけて管理するためのものである。データベースでは、表をテーブル、表の列をカラム、表の行をレコードと呼ぶ。リレーショナルデータベースでは、テーブル同士の関係を設定し、関連づけることができる。
【0210】
通常、各テーブルにはレコードを一意に特定するためのキーとなるカラムが設定されるが、カラムへのキーの設定は必須ではない。制御部は、各種プログラムに従ってプロセッサ94に、記憶部に記憶された特定のテーブルにレコードを追加、削除、更新を実行させることができる。
【0211】
通信部は、通信IF99により実現される。通信部は、ネットワークを介して他のコンピュータ90と通信を行う機能を実現する。通信部は、他のコンピュータ90から送信された情報を受信し、制御部へ入力することができる。制御部は、各種プログラムに従ってプロセッサ94に、受信した情報に対する情報処理を実行させることができる。また、通信部は、制御部から出力された情報を他のコンピュータ90へ送信することができる。
【0212】
本明細書中に記載されている構成要素により実現される機能は、当該記載された機能を実現するようにプログラムされた、汎用プロセッサ、特定用途プロセッサ、集積回路、ASICs (Application Specific Integrated Circuits)、CPU (a Central Processing Unit)、従来型の回路、および/又はそれらの組合せを含む、circuitry又はprocessing circuitryにおいて実装されてもよい。プロセッサは、トランジスタやその他の回路を含み、 circuitry又はprocessing circuitryとみなされる。プロセッサは、メモリに格納されたプログラムを実行する、programmed processorであってもよい。
本明細書において、circuitry、ユニット、手段は、記載された機能を実現するようにプログラムされたハードウェア、又は実行するハードウェアである。当該ハードウェアは、本明細書に開示されているあらゆるハードウェア、又は、当該記載された機能を実現するようにプログラムされた、又は、実行するものとして知られているあらゆるハードウェアであってもよい。
当該ハードウェアがcircuitryのタイプであるとみなされるプロセッサである場合、当該circuitry、手段、又はユニットは、ハードウェアと、当該ハードウェア及び又はプロセッサを構成する為に用いられるソフトウェアの組合せである。
【0213】
以上、本開示のいくつかの実施形態を説明したが、これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものとする。
【0214】
<付記>
以上の各実施形態で説明した事項を以下に付記する。
(付記1)
プロセッサとメモリとを備えるコンピュータを動作させるためのプログラムであって、プログラムは、プロセッサに、第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童または集団が関連する画像として特定するステップと、特定された画像の状況を読み取ることと、読み取った状況に基づいて、生成対象として指定された児童または集団に関する文章案を生成することとを含むプロンプトを生成するステップと、画像に関する情報を含むプロンプトを大規模言語モデルに入力することで、大規模言語モデルから文章案を取得するステップと、取得した文章案を、第1のユーザに提示するステップと、を実行させる、プログラム。
(付記2)
文章案は、児童福祉に関する活動を記録するための書類に記載する文章の案である、付記1に記載のプログラム。
(付記3)
生成対象の指定を受け付けるステップにおいて、書類の種別の指定を受け付け、プロンプトを生成するステップにおいて、指定された種別に応じて異なる指示を含むプロンプトを生成する、付記1または付記2に記載のプログラム。
(付記4)
プロンプトを生成するステップにおいて、指定された種別に応じて異なる、文章案の出力形式に関する情報を含むプロンプトを生成する、付記3に記載のプログラム。
(付記5)
生成対象の指定を受け付けるステップにおいて、1または複数の時間帯の指定を受け付け、プログラムは、プロセッサに、指定された時間帯と特定された画像に関連付けられた時刻情報とに基づいて、時間帯に対応する画像を決定するステップを実行させ、プロンプトを生成するステップにおいて、時間帯に対応する画像の状況を読み取ることで、時間帯に関する文章を含む文章案を生成する指示を含むプロンプトを生成する、付記1から付記4のいずれかに記載のプログラム。
(付記6)
特定するステップにおいて、複数の画像を特定し、生成対象の指定を受け付けるステップにおいて、複数の時間帯の指定を受け付け、時間帯に対応する画像を決定するステップにおいて、指定された複数の時間帯にそれぞれ対応する複数の画像を決定し、プロンプトを生成するステップにおいて、複数の時間帯に対応する複数の画像の状況をそれぞれ読み取ることで、複数の時間帯ごとに区切られた文章を生成する指示を含むプロンプトを生成する、付記5に記載のプログラム。
(付記7)
生成対象の指定を受け付けるステップにおいて、1つまたは複数の場面の指定を受け付け、プロンプトを生成するステップにおいて、特定された画像から場面に対応する画像を決定することと、場面に対応する画像の状況を読み取ることと、場面に関する文章を含む文章案を生成することとを含むプロンプトを生成する、付記1から付記6のいずれかに記載のプログラム。
(付記8)
プログラムは、プロセッサに、指定された児童または集団に所属する児童の状態に関する情報と時刻情報とが関連付けて記録されたログ情報を取得するステップを実行させ、プロンプトを生成するステップにおいて、ログ情報を参照して文章案を生成する指示を含むプロンプトを生成する、付記1から付記7のいずれかに記載のプログラム。
(付記9)
生成対象の指定を受け付けるステップにおいて、1または複数の時間帯の指定を受け付け、プロンプトを生成するステップにおいて、指定された時間帯とログ情報に含まれる時刻情報とを参照して、時間帯に対応する児童の状態に関する文章を含む文章案を生成する指示を含むプロンプトを生成する、付記8に記載のプログラム。
(付記10)
プロンプトを生成するステップにおいて、特定された画像から、生成した文章案に対する添付画像を選択する指示を含むプロンプトを生成し、文章案を取得するステップにおいて、添付画像に関する情報を取得し、文章案を提示するステップにおいて、取得した添付画像を提示する、付記1から付記9のいずれかに記載のプログラム。
(付記11)
プログラムは、プロセッサに、大規模言語モデルから取得した文章案を、生成対象として指定された児童または集団に関連付けてデータベースに記憶するステップと、第2のユーザから、評価対象として、児童または児童が所属する集団の指定を受け付けるステップと、データベースに記憶される1または複数の文章案から、評価対象として指定された児童または児童が所属する集団に関連付けられた文章案を抽出するステップと、抽出された文章案のテキストデータを分析することにより、評価対象として指定された児童または児童が所属する集団を評価するステップと、評価の結果を第2のユーザに提示するステップと、を実行させる、付記1から付記10のいずれかに記載のプログラム。
(付記12)
評価するステップにおいて、抽出された文章案のテキストデータに対してテキストマイニングを行い、抽出された文章案の特徴を抽出することにより、評価対象として指定された児童または児童が所属する集団を評価する、付記11に記載のプログラム。
(付記13)
プロセッサを備えるコンピュータによって実行される方法であって、プロセッサが、第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童または集団が関連する画像として特定するステップと、特定された画像の状況を読み取ることと、読み取った状況に基づいて、生成対象として指定された児童または集団に関する文章案を生成することとを含むプロンプトを生成するステップと、画像に関する情報を含むプロンプトを大規模言語モデルに入力することで、大規模言語モデルから文章案を取得するステップと、取得した文章案を、第1のユーザに提示するステップと、を実行する方法。
(付記14)
制御部を備える情報処理装置であって、制御部が、第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童または集団が関連する画像として特定するステップと、特定された画像の状況を読み取ることと、読み取った状況に基づいて、生成対象として指定された児童または集団に関する文章案を生成することとを含むプロンプトを生成するステップと、画像に関する情報を含むプロンプトを大規模言語モデルに入力することで、大規模言語モデルから文章案を取得するステップと、取得した文章案を、第1のユーザに提示するステップと、を実行する情報処理装置。
(付記15)
第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付ける手段と、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童または集団が関連する画像として特定する手段と、特定された画像の状況を読み取ることと、読み取った状況に基づいて、生成対象として指定された児童または集団に関する文章案を生成することとを含むプロンプトを生成する手段と、画像に関する情報を含むプロンプトを大規模言語モデルに入力することで、大規模言語モデルから文章案を取得する手段と、取得した文章案を、第1のユーザに提示する手段と、を具備するシステム。
【符号の説明】
【0215】
1…システム 10…端末装置 12…通信IF 120…通信部 13…入力装置 14…出力装置 141…ディスプレイ 15…メモリ 16…ストレージ 17…音声処理部 180…記憶部 19…プロセッサ 190…制御部 20…サーバ
【要約】
【課題】書類に記載する文章の作成を効率化する。
【解決手段】プログラムは、プロセッサに、第1のユーザから、文章案の生成対象として、児童または児童が所属する集団の指定を受け付けるステップと、データベースに記憶される児童福祉に関する活動の様子が記録された画像のうち、1または複数の画像を、生成対象として指定された児童または集団が関連する画像として特定するステップと、特定された画像の状況を読み取ることと、読み取った状況に基づいて、生成対象として指定された児童または集団に関する文章案を生成することとを含む指示を含むプロンプトを生成するステップと、画像に関する情報を含むプロンプトを大規模言語モデルに入力することで、大規模言語モデルから文章案を取得するステップと、取得した文章案を、第1のユーザに提示するステップと、を実行させる。
【選択図】図14
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18