IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サイボウズ株式会社の特許一覧 ▶ サイボウズ・ラボ株式会社の特許一覧

特許7649839再学習システム、再学習方法、及びプログラム
<>
  • 特許-再学習システム、再学習方法、及びプログラム 図1
  • 特許-再学習システム、再学習方法、及びプログラム 図2
  • 特許-再学習システム、再学習方法、及びプログラム 図3
  • 特許-再学習システム、再学習方法、及びプログラム 図4
  • 特許-再学習システム、再学習方法、及びプログラム 図5
  • 特許-再学習システム、再学習方法、及びプログラム 図6
  • 特許-再学習システム、再学習方法、及びプログラム 図7
  • 特許-再学習システム、再学習方法、及びプログラム 図8
  • 特許-再学習システム、再学習方法、及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-03-12
(45)【発行日】2025-03-21
(54)【発明の名称】再学習システム、再学習方法、及びプログラム
(51)【国際特許分類】
   G06Q 10/10 20230101AFI20250313BHJP
【FI】
G06Q10/10 310
【請求項の数】 8
(21)【出願番号】P 2023208002
(22)【出願日】2023-12-08
【審査請求日】2023-12-08
(73)【特許権者】
【識別番号】500022557
【氏名又は名称】サイボウズ株式会社
(73)【特許権者】
【識別番号】506118098
【氏名又は名称】サイボウズ・ラボ株式会社
(74)【代理人】
【識別番号】110000154
【氏名又は名称】弁理士法人はるか国際特許事務所
(72)【発明者】
【氏名】中谷 秀洋
(72)【発明者】
【氏名】山口 洋平
【審査官】小原 正信
(56)【参考文献】
【文献】特許第7368034(JP,B1)
【文献】鈴木 雅弘,事前学習と追加事前学習による金融言語モデルの構築と検証,人工知能学会 金融情報学研究会(SIG-FIN) 第28回研究会 [online] ,日本,人工知能学会,2022年03月12日,132~137ページ
【文献】岡▲崎▼ 直観,新時代の道具,ChatGPT:14の視点からその可能性を探る 大規模言語モデルの驚異と脅威-ChatGPTの衝撃と大規模言語モデルの課題-,情報処理 第64巻 第9号 [online] ,日本,情報処理学会,2023年08月15日,第64巻,e1~e3 ページ,[ISSN]0447-8053
【文献】鈴木 剛 ,「仕事のAI」における大規模言語モデルの個別チューニングを可能にするデータとモデルの共同設計 ,リコーテクニカルレポート No.45 [online] ,株式会社リコー,2023年05月25日,No.45,2023,第38~46ページ
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
事前学習済みの大規模言語モデルを取得する大規模言語モデル取得部と、
ユーザの業務を支援する業務支援システムに特有の業務支援モデルが行う業務支援タスクごとに、前記業務支援システムで行われた前記ユーザのアクティビティを示すアクティビティデータであって、複数の組織の各々の前記アクティビティデータに基づいて作成された、前記複数の組織に共通の訓練データである共通訓練データを取得する訓練データ取得部と、
前記業務支援タスクごとに、前記共通訓練データに基づいて、前記大規模言語モデルの再学習を実行することによって、前記複数の組織に共通の前記業務支援モデルである共通業務支援モデルを作成する再学習部と、
を含み、
前記訓練データ取得部は、前記組織ごとに、当該組織の前記アクティビティデータに基づいて作成された、当該組織に特有の前記訓練データである特有訓練データを取得し、
前記再学習部は、前記組織ごとに、当該組織の前記特有訓練データに基づいて、前記共通業務支援モデルの再学習を実行することによって、当該組織に特有の前記業務支援モデルである特有業務支援モデルを作成する、
学習システム。
【請求項2】
事前学習済みの大規模言語モデルを取得する大規模言語モデル取得部と、
ユーザの業務を支援する業務支援システムに特有の業務支援モデルが行う業務支援タスクごとに、前記業務支援システムで行われた前記ユーザのアクティビティを示すアクティビティデータであって、前記業務支援システムが有する複数の業務支援機能の各々の前記アクティビティデータに基づいて作成された、前記複数の業務支援機能に共通の訓練データである共通訓練データを取得する訓練データ取得部と、
前記業務支援タスクごとに、前記共通訓練データに基づいて、前記大規模言語モデルの再学習を実行することによって、前記複数の業務支援機能に共通の前記業務支援モデルである共通業務支援モデルを作成する再学習部と、
を含み、
前記訓練データ取得部は、前記業務支援機能ごとに、当該業務支援機能の前記アクティビティデータに基づいて作成された、当該業務支援機能に特有の前記訓練データである特有訓練データを取得し、
前記再学習部は、前記業務支援機能ごとに、当該業務支援機能の前記特有訓練データに基づいて、前記共通業務支援モデルの再学習を実行することによって、当該業務支援機能に特有の前記業務支援モデルである特有業務支援モデルを作成する、
学習システム。
【請求項3】
事前学習済みの大規模言語モデルを取得する大規模言語モデル取得部と、
ユーザの業務を支援する業務支援システムが有する業務支援機能ごとに、複数の組織の各々における前記ユーザのアクティビティを示すアクティビティデータに基づいて作成された、前記複数の組織に共通の訓練データである共通訓練データを取得する訓練データ取得部と、
前記業務支援機能ごとに、前記共通訓練データに基づいて、前記大規模言語モデルの再学習を実行することによって、前記業務支援システムに特有の業務支援モデルであって、前記複数の組織に共通の前記業務支援モデルである共通業務支援モデルを作成する再学習部と、
を含み、
前記訓練データ取得部は、前記組織ごとに、当該組織の前記アクティビティに基づいて作成された、当該組織に特有の前記訓練データである特有訓練データを取得し、
前記再学習部は、前記組織ごとに、当該組織の前記特有訓練データに基づいて、前記共通業務支援モデルの再学習を実行することによって、当該組織に特有の前記業務支援モデルである特有業務支援モデルを作成する、
学習システム。
【請求項4】
前記再学習システムは、複数の前記訓練データの各々と、複数の前記業務支援モデルの各々と、に基づいて、新たな訓練データを作成する訓練データ作成部を更に含み、
前記再学習部は、前記新たな訓練データに基づいて、前記複数の業務支援モデルの少なくとも1つの更なる再学習を実行する、
を更に含む請求項の何れかに記載の再学習システム。
【請求項5】
前記訓練データ取得部は、前記業務支援システムに新規登録した第1組織の前記アクティビティデータに基づいて作成された前記訓練データである第1組織訓練データと、前記第1組織と関連する第2組織であって、前記第1組織よりも前記業務支援システムの利用期間が長い前記第2組織の前記アクティビティデータに基づいて作成された前記訓練データである第2組織訓練データと、を取得し、
前記再学習部は、前記第1組織訓練データだけではなく前記第2組織訓練データも前記業務支援モデルに学習させることによって、前記業務支援システムに新規登録した前記第1組織に特有の前記業務支援モデルを作成する、
請求項の何れかに記載の再学習システム。
【請求項6】
前記訓練データ取得部は、前記アクティビティデータが示す前記アクティビティの全体と、前記アクティビティデータの中から選択された一部分と、示す前記訓練データを取得し、
前記再学習部は、前記全体及び前記一部分を示す前記訓練データに基づいて、前記大規模言語モデルの再学習を実行することによって、前記業務支援モデルを作成する、
請求項の何れかに記載の再学習システム。
【請求項7】
事前学習済みの大規模言語モデルを取得し、
ユーザの業務を支援する業務支援システムに特有の業務支援モデルが行う業務支援タスクごとに、前記業務支援システムで行われた前記ユーザのアクティビティを示すアクティビティデータであって、複数の組織の各々の前記アクティビティデータに基づいて作成された、前記複数の組織に共通の訓練データである共通訓練データを取得し、
前記業務支援タスクごとに、前記共通訓練データに基づいて、前記大規模言語モデルの再学習を実行することによって、前記複数の組織に共通の前記業務支援モデルである共通業務支援モデルを作成する、
再学習方法であって、
前記組織ごとに、当該組織の前記アクティビティデータに基づいて作成された、当該組織に特有の前記訓練データである特有訓練データを取得し、
前記組織ごとに、当該組織の前記特有訓練データに基づいて、前記共通業務支援モデルの再学習を実行することによって、当該組織に特有の前記業務支援モデルである特有業務支援モデルを作成する、
再学習方法。
【請求項8】
事前学習済みの大規模言語モデルを取得する大規模言語モデル取得部、
ユーザの業務を支援する業務支援システムに特有の業務支援モデルが行う業務支援タスクごとに、前記業務支援システムで行われた前記ユーザのアクティビティを示すアクティビティデータであって、複数の組織の各々の前記アクティビティデータに基づいて作成された、前記複数の組織に共通の訓練データである共通訓練データを取得する訓練データ取得部、
前記業務支援タスクごとに、前記共通訓練データに基づいて、前記大規模言語モデルの再学習を実行することによって、前記複数の組織に共通の前記業務支援モデルである共通業務支援モデルを作成する再学習部、
としてコンピュータを機能させ
前記訓練データ取得部は、前記組織ごとに、当該組織の前記アクティビティデータに基づいて作成された、当該組織に特有の前記訓練データである特有訓練データを取得し、
前記再学習部は、前記組織ごとに、当該組織の前記特有訓練データに基づいて、前記共通業務支援モデルの再学習を実行することによって、当該組織に特有の前記業務支援モデルである特有業務支援モデルを作成する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、再学習システム、再学習方法、及びプログラムに関する。
【背景技術】
【0002】
従来、ユーザの業務を支援する業務支援システムが知られている。例えば、特許文献1には、業務支援システムの一例として、組織に属するユーザ間のコミュニケーションを支援するグループウェアが記載されている。特許文献1の業務支援システムは、ユーザが操作を行わない無入力期間が発生するか否か推定する学習済みモデルに対し、ユーザによるグループウェアの使用パターンを示すデータを入力する。学習済みモデルは、当該データに基づいて、無入力期間が発生するか否かを推定する。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2023-091326号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、自然言語処理の分野で利用される大規模言語モデルは、特許文献1のような単純な分類を行う学習済みモデルとは異なり、非常に多くの言語を解析する必要がある。このため、特許文献1をはじめとする従来の技術は、業務支援システムに有用な大規模言語モデルを実現することはできなかった。
【0005】
本開示の目的の1つは、業務支援システムに有用な大規模言語モデルを実現することである。
【課題を解決するための手段】
【0006】
本開示に係る再学習システムは、事前学習済みの大規模言語モデルを取得する大規模言語モデル取得部と、ユーザの業務を支援する業務支援システムで行われた前記ユーザのアクティビティを示すアクティビティデータに基づいて作成された、前記大規模言語モデルの再学習用の訓練データを取得する訓練データ取得部と、前記訓練データに基づいて、前記大規模言語モデルの再学習を実行することによって、前記業務支援システムに特有の業務支援モデルを作成する再学習部と、を含む。
【発明の効果】
【0007】
本開示は、業務支援システムに有用な大規模言語モデルを実現できる。
【図面の簡単な説明】
【0008】
図1】再学習システムのハードウェア構成の一例を示す図である。
図2】ユーザ端末に表示される画面の一例を示す図である。
図3】大規模言語モデル及び業務支援モデルの関係の一例を示す図である。
図4】再学習システムで実現される機能の一例を示す図である。
図5】訓練データベースの一例を示す図である。
図6】ユーザデータベースの一例を示す図である。
図7】再学習システムで実行される処理の一例を示す図である。
図8】多段階の再学習の一例を示す図である。
図9】変形例4で実現される機能の一例を示す図である。
【発明を実施するための形態】
【0009】
[1.再学習システムのハードウェア構成]
本開示に係る再学習システム、再学習方法、及びプログラムの実施形態の一例を説明する。図1は、再学習システムのハードウェア構成の一例を示す図である。例えば、再学習システム1は、再学習端末10及び業務支援システム2を含む。業務支援システム2は、業務支援サーバ20及びユーザ端末30を含む。再学習端末10、業務支援サーバ20、及びユーザ端末30の各々は、インターネット又はLAN等のネットワークNに接続される。
【0010】
再学習端末10は、後述の再学習を実行するコンピュータである。例えば、再学習端末10は、パーソナルコンピュータ、サーバコンピュータ、又はタブレットである。例えば、再学習端末10は、制御部11、記憶部12、通信部13、操作部14、及び表示部15を含む。例えば、制御部11は、少なくとも1つのプロセッサを含む。記憶部12は、RAM等の揮発性メモリと、フラッシュメモリ等の不揮発性メモリと、の少なくとも一方を含む。通信部13は、有線通信用の通信インタフェースと、無線通信用の通信インタフェースと、の少なくとも一方を含む。操作部14は、マウス、タッチパネル、又はキーボード等の入力デバイスである。表示部15は、液晶又は有機ELのディスプレイである。
【0011】
業務支援サーバ20は、サーバコンピュータである。例えば、業務支援サーバ20は、制御部21、記憶部22、及び通信部23を含む。制御部21、記憶部22、及び通信部23の各々のハードウェア構成は、それぞれ制御部11、記憶部12、及び通信部13と同様であってよい。
【0012】
ユーザ端末30は、ユーザのコンピュータである。例えば、ユーザ端末30は、パーソナルコンピュータ、タブレット、スマートフォン、又はウェアラブル端末である。例えば、ユーザ端末30は、制御部31、記憶部32、通信部33、操作部34、及び表示部35を含む。制御部31、記憶部32、通信部33、操作部34、及び表示部35の各々のハードウェア構成は、それぞれ制御部11、記憶部12、通信部13、操作部14、及び表示部15と同様であってよい。
【0013】
なお、記憶部12、記憶部22、及び記憶部32の少なくとも1つに記憶されるプログラムは、ネットワークNを介して再学習端末10、業務支援サーバ20、及びユーザ端末30の少なくとも1つに供給されてもよい。また、再学習端末10、業務支援サーバ20、及びユーザ端末30の少なくとも1つのハードウェア構成は、図1の例に限られない。例えば、再学習端末10、業務支援サーバ20、及びユーザ端末30の少なくとも1つは、情報記憶媒体を読み取る読取部(例えば、メモリカードスロット)と、情報記憶媒体と接続する入出力部(例えば、USB端子)と、の少なくとも一方を含んでもよい。この場合、情報記憶媒体に記憶されたプログラムが、読取部及び入出力部の少なくとも一方を介して、再学習端末10、業務支援サーバ20、及びユーザ端末30の少なくとも1つに供給されてもよい。
【0014】
また、再学習システム1に含まれるコンピュータは、図1の例に限られない。再学習システム1は、少なくとも1つのコンピュータを含めばよい。例えば、再学習システム1は、再学習端末10だけを含んでもよい。この場合、業務支援システム2は、再学習システム1の外部に存在する。例えば、再学習システム1は、図1には示さないコンピュータを含んでもよい。
【0015】
[2.再学習システムの概要]
本実施形態では、業務支援システム2がグループウェアである場合を例に挙げる。例えば、業務支援システム2は、会社又は行政機関等の組織に属するユーザの業務を支援する。ユーザは、業務支援システム2が有する業務支援機能を利用する。業務支援機能は、業務支援のために開発されたプログラム(例えば、業務支援サーバ20が記憶するプログラム、又は、ユーザ端末30が記憶するログラム)が有する機能である。
【0016】
業務支援機能は、公知の種々の機能であってよい。例えば、業務支援機能は、ユーザがスレッドでコミュニケーションを取るためのスレッド機能、ユーザがスケジュールを管理するためのスケジュール機能、ユーザがデータベースを管理するためのデータベース機能、ユーザがファイルを管理するためのファイル管理機能、又はユーザが電子メールを管理するためのメール管理機能であってもよい。業務支援機能は、公知のグループウェアで実装されている他の機能であってもよい。
【0017】
なお、業務支援システム2は、グループウェアに分類されないシステムであってもよい。例えば、業務支援システム2は、組織とは関係のない業務を支援するシステム、他の製品との連動のための機能を有しないシステム、又はその他のシステムであってもよい。業務支援システム2は、ユーザの何らかの業務を支援するシステムであればよい。
【0018】
図2は、ユーザ端末30に表示される画面の一例を示す図である。例えば、ユーザが、ユーザ端末30を操作して業務支援システム2にログインすると、ユーザ端末30は、ユーザの業務を支援するための業務支援画面SCを、表示部35に表示させる。ユーザは、業務支援画面SCから、任意の業務支援機能を利用できる。図2の例では、ユーザがスレッド機能を利用する場合の業務支援画面SCが示されている。ユーザは、業務支援画面SCに表示されたスレッドに対し、任意のメッセージを投稿できる。
【0019】
図2のようなスレッド以外にも、業務支援システム2には、種々のテキストが登録される。業務支援システム2が、自身に登録されたテキストを言語解析できれば、ユーザの業務を効果的に支援できると考えられる。例えば、業務支援システム2が、スレッドに登録されたテキストを解析してスレッドのサマリを作成できれば、ユーザがスレッドにおける話題を簡単に理解できるようになる。スレッド機能以外の他の業務支援機能でも同様に、テキストの言語解析は、有用と考えられる。ただし、業務支援システム2の運営会社が、言語解析のための大規模言語モデルを1から作成するのは、非常に手間がかかる。
【0020】
そこで、再学習システム1は、事前学習済みの大規模言語モデルの再学習を実行することによって、業務支援システム2に特有の業務支援モデルを作成する。事前学習済みの大規模言語モデルは、自然言語処理の分野で利用される公知のモデルであってよい。例えば、大規模言語モデルは、リカレントニューラルネットワーク型のモデル、長短期記憶ネットワーク型のモデル、又はTransformer型のモデルであってもよい。
【0021】
本実施形態では、大規模言語モデルが、Transformer型のモデルである場合を例に挙げる。例えば、大規模言語モデルは、GPT(Generative Pre-trained Transformer)又はBERT(Bidirectional Encoder Representations from Transformers)のモデルであってもよい。Transformer型のモデルに分類されることがあるPaLM(Pathways Language Model)又はLLaMA(Large Language Model Meta AI)が、大規模言語モデルとして利用されてもよい。大規模言語モデルは、機械学習の手法が利用された他のモデルであってもよい。
【0022】
例えば、大規模言語モデルは、テキストが入力されると、当該テキストを複数のトークンに分割する。トークンは、大規模言語モデルがテキストを理解するための要素である。例えば、トークンは、単語、形態素、フレーズ、又は文字である。大規模言語モデルは、複数のトークンの各々を埋め込み表現に変換する。大規模言語モデルは、複数のトークンの各々の埋め込み表現の並びに基づいて、自身に入力されたテキストの文脈を理解する。大規模言語モデルは、テキストの文脈に基づいて、自身のタスクに応じた出力を行う。大規模言語モデルは、中間層及び出力層といった各層のパラメータに基づいて、これらの一連の処理を実行する。大規模言語モデルは、数億~数千億のパラメータを有することもある。
【0023】
例えば、大規模言語モデルの事前学習は、再学習システム1に含まれない他のコンピュータによって実行される。業務支援システム2の運営会社は、他のコンピュータによって事前学習が実行された大規模言語モデルを、有償又は無償で取得する。大規模言語モデルは、事前学習によって、ユーザの業務をある程度支援することはできる。ただし、大規模言語モデルの事前学習は、業務支援とは関係のない汎用的なデータに基づいて実行されるので、業務支援に特有の言語解析を実行できるわけではない。そこで、再学習システム1は、業務支援に特有のデータに基づいて、大規模言語モデルの再学習を実行する。
【0024】
再学習は、大規模言語モデルの少なくとも一部の変更のための処理である。例えば、再学習は、大規模言語モデルのパラメータの調整である。再学習は、大規模言語モデルに含まれる一部の層の付け替えであってもよい。本実施形態では、ファインチューニングが再学習に相当する場合を例に挙げる。例えば、ファインチューニングは、大規模言語モデルのパラメータが所定のタスクに合うようにするためのパラメータの調整である。ファインチューニングの意味は、諸説ある公知の意味であってよい。ファインチューニングは、本実施形態の例に限られない。
【0025】
なお、再学習は、ファインチューニングに限られない。再学習は、大規模言語モデルの少なくとも一部の変更のための処理であればよい。例えば、再学習は、転移学習又は蒸留であってもよい。転移学習又は蒸留の意味も諸説あるが、転移学習又は蒸留は、諸説ある公知の意味であってよい。再学習は、ファインチューニング、転移学習、及び蒸留以外の他の処理であってもよい。以降、再学習後の大規模言語モデルを、業務支援モデルという。単に大規模言語モデルと記載した箇所は、事前学習済みの大規模言語モデル(再学習前の大規模言語モデル)を意味する。
【0026】
図3は、大規模言語モデル及び業務支援モデルの関係の一例を示す図である。例えば、大規模言語モデルM1が特定のタスクを処理できるように、大規模言語モデルM1の事前学習が実行されている。本実施形態のタスクは、一般的なタスクとは異なり、業務支援のためのタスクである。以降では、本実施形態のタスクを、業務支援タスクという。図3の例では、スレッドのサマリ作成が業務支援タスクに相当する。
【0027】
なお、業務支援タスクは、スレッドのサマリ作成に限られない。例えば、業務支援タスクは、スレッドのメッセージ以外のテキスト(例えば、電子メールの本文、データベースのコメント機能によって投稿されたコメント、又はヘルプページ等のウェブサイトのテキスト)のサマリ作成、何らかのテキストの自動作成、機械翻訳、ユーザの質問に対する回答、業務支援システム2に登録されたデータの抽出、業務支援システム2に登録されたデータの分類、ユーザの行動の分析、ユーザの行動の予測、又はその他のタスクであってもよい。
【0028】
例えば、大規模言語モデルM1に、業務支援システム2に投稿されたスレッドを示すスレッドデータが入力されたとする。大規模言語モデルM1は、事前学習によって調整されたパラメータに基づいて、スレッドデータが示すスレッドのテキストを解析する。大規模言語モデルM1は、当該テキストの解析結果に基づいて、スレッドのサマリを示すサマリデータを出力する。大規模言語モデルM1の事前学習は、汎用的なデータに基づいて実行されているので、大規模言語モデルM1は、ある程度の精度のサマリを作成できるが、業務支援に特有のサマリを作成できない可能性がある。
【0029】
例えば、一般的なサマリでは、サマリの作成対象となるテキストの冒頭と最後の部分が重要だったとする。この場合、大規模言語モデルM1がテキストの冒頭と最後の部分に基づいてサマリを作成するように、大規模言語モデルM1の事前学習が実行される。大規模言語モデルM1は、自身に入力されたスレッドデータが示すスレッドにおける冒頭と最後の部分に基づいて、スレッドのサマリを作成する。
【0030】
一方で、業務支援のためのサマリでは、テキストの冒頭と最後よりも、会議の日時を含む部分と、役職の高いユーザが入力したテキストと、が重要だったとする。この場合、テキストの冒頭と最後に、これらの内容が含まれていなければ、大規模言語モデルM1が作成したサマリは、あまり有用ではない可能性がある。例えば、大規模言語モデルM1が作成したサマリは、会議の日時を含まず、かつ、役職の高いユーザが入力したテキストを含まない可能性がある。
【0031】
そこで、本実施形態の再学習システム1は、業務支援システム2におけるユーザのアクティビティを示すアクティビティデータに基づいて、大規模言語モデルM1の再学習を実行する。アクティビティは、業務支援システム2に対するユーザの入力である。アクティビティデータには、業務支援に有用な情報が含まれているので、再学習によって、業務支援に有用な業務支援モデルM2が作成される。図3の例では、スレッドデータがアクティビティデータに相当する。スレッドデータ以外のアクティビティデータ例は、後述する。
【0032】
例えば、業務支援モデルM2には、再学習用に用意されたスレッドと、当該スレッドから作成された正解となるサマリと、の関係を示す訓練データが学習されている。本実施形態では、業務支援システム2の運営会社が、正解となるサマリを作成する場合を例に挙げる。例えば、スレッドに投稿されたメッセージのうち、会議の日時を含むメッセージと、役職の高いユーザのメッセージと、が正解となるサマリに含まれるように、訓練データが作成される。このような訓練データに基づく再学習が実行されることにより、業務支援モデルM2は、業務支援に特有のサマリを作成できるようになる。
【0033】
以上のように、再学習システム1は、汎用的なデータに基づく事前学習が実行された大規模言語モデルM1の再学習を実行することによって、業務支援に特有の業務支援モデルM2を作成する。例えば、業務支援システム2の運営会社が、業務支援モデルM2の学習を1から行うことは現実的ではないが、再学習システム1は、大規模言語モデルM1の再学習によって、業務支援システム2に有用な業務支援モデルM2を実現できる。以降、再学習システム1の詳細を説明する。
【0034】
[3.再学習システムで実現される機能]
図4は、再学習システム1で実現される機能の一例を示す図である。
【0035】
[3-1.再学習端末で実現される機能]
例えば、再学習端末10は、データ記憶部100、大規模言語モデル取得部101、訓練データ取得部102、及び再学習部103を含む。データ記憶部100は、記憶部12により実現される。大規模言語モデル取得部101、訓練データ取得部102、及び再学習部103の各々は、制御部11により実現される。
【0036】
[データ記憶部]
データ記憶部100は、再学習に必要なデータを記憶する。例えば、データ記憶部100は、大規模言語モデルM1を記憶する。大規模言語モデルM1は、事前学習によって調整されたパラメータ(再学習前のパラメータ)と、埋め込み表現の計算等の処理のためのプログラムと、を含む。
【0037】
大規模言語モデルM1のパラメータは、大規模言語モデルM1のプログラムによって参照される。例えば、パラメータは、重み係数及びバイアスである。パラメータは、公知の種々のパラメータであってよい。パラメータは、重み係数及びバイアスに限られない。例えば、パラメータは、埋め込み表現の計算時に参照される行列、トークン位置のエンコーディングで参照される位置エンコーディング、又はその他のパラメータであってもよい。
【0038】
大規模言語モデルM1のプログラムは、大規模言語モデルM1の内部処理を示す。例えば、大規模言語モデルM1のプログラムは、埋め込み表現を計算するエンコーダ、埋め込み表現から業務支援タスクに特有の出力を作成するデコーダ、最終的な出力を行う出力層、及び他の層の処理を示す。これらの処理では、パラメータが参照される。ある特定の業務支援タスクに特有のパラメータが存在することもある。大規模言語モデルM1のプログラムは、公知のプログラムであってよい。
【0039】
例えば、再学習部103による再学習が完了すると、データ記憶部100は、再学習済みの業務支援モデルM2を記憶する。本実施形態では、大規模言語モデルM1と、再学習済みの業務支援モデルM2と、が別々のデータである場合を例に挙げる。これらが別々のデータではなく、大規模言語モデルM1が業務支援モデルM2によって上書きされてもよい。データ記憶部100は、大規模言語モデルM1及び業務支援モデルM2だけではなく、訓練データベースDB1も記憶する。
【0040】
図5は、訓練データベースDB1の一例を示す図である。訓練データベースDB1は、大規模言語モデルM1の再学習に必要な訓練データが格納されたデータベースである。例えば、訓練データは、再学習時に大規模言語モデルM1に入力される入力部分と、再学習時に正解となる出力部分と、を含む。入力部分及び出力部分の組み合わせは、業務支援タスクに応じた組み合わせであればよい。訓練データは、手入力によって用意されてもよいし、公知のツールによって用意されてもよい。
【0041】
訓練データの入力部分は、アクティビティデータそのものであってもよいし、アクティビティデータに基づいて作成された別のデータであってもよい。大規模言語モデルM1は、言語解析を実行するので、アクティビティデータは、ユーザが入力したテキストを示す。アクティビティデータは、テキスト以外の他のアクティビティを示してもよい。例えば、アクティビティは、ユーザのリアクション(例えば、いいね又は絵文字リアクション)、閲覧数、返信数、テキストの投稿日時、又はその他の内容を示してもよい。
【0042】
訓練データの出力部分は、業務支援タスクに応じた内容を示す。例えば、業務支援タスクが、サマリのような何らかのテキストの出力であれば、訓練データの出力部分は、正解となるテキストである。業務支援タスクが何らかの分類(ラベル)の出力であれば、訓練データの出力部分は、正解となる分類である。業務支援タスクが何らかのデータの抽出であれば、訓練データの出力部分は、正解となるデータ(訓練データの入力部分から抽出されるべきデータ)である。業務支援タスクが何らかのデータのソートであれば、訓練データの出力部分は、正解となる順序である。
【0043】
本実施形態では、スレッドのサマリ作成が業務支援タスクに相当する場合を例に挙げる。このため、図5の例では、訓練データの入力部分は、再学習用のスレッドデータである。訓練データの入力部分として利用されるスレッドデータは、業務支援システム2に実際に存在するスレッドデータであってもよいし、業務支援システム2の運営会社が用意した仮想的なスレッドの内容を示すスレッドデータであってもよい。図5の例では、訓練データの出力部分は、訓練データの入力部分であるスレッドデータから作成された正解となるサマリを示すサマリデータである。
【0044】
なお、訓練データは、本実施形態の例に限られない。訓練データは、業務支援タスクに応じた内容を示せばよい。訓練データの入力部分は、学習用のアクティビティデータ、又は、学習用のアクティビティデータに基づいて作成されたデータであればよい。訓練データの出力部分は、訓練データの入力部分に対する処理結果としての正解を示せばよい。訓練データの入力部分及び出力部分は、業務支援タスクに応じた内容を示せばよい。以下、業務支援タスクに応じた訓練データの一例を説明するが、訓練データは、下記の例に限られない。
【0045】
例えば、業務支援タスクが、スレッドのメッセージ以外のテキスト(例えば、電子メールの本文、データベースのコメント機能によって投稿されたコメント、又はヘルプページ等のウェブサイトのテキスト)のサマリ作成である場合、訓練データの入力部分は、サマリの作成対象となるテキストを示す。この場合の訓練データの出力部分は、当該テキストから作成された正解となるサマリを示す。
【0046】
例えば、業務支援タスクが、何らかのテキスト(例えば、スレッドに投稿されるメッセージ、電子メールの本文、データベースのコメント機能によって投稿されるコメント、又はヘルプページ等のウェブサイトのテキスト)の自動作成である場合、訓練データの入力部分は、作成対象となるテキストの条件を示す。この場合の訓練データの出力部分は、当該条件に応じた正解となるテキストを示す。
【0047】
例えば、業務支援タスクが、機械翻訳である場合、訓練データの入力部分は、翻訳前のテキスト(原語のテキスト)である。この場合の訓練データの出力部分は、正解となる翻訳後のテキストである。例えば、業務支援タスクが、ユーザの質問に対する回答である場合、訓練データの入力部分は、再学習用に用意された質問を示す。この場合の訓練データの出力部分は、当該質問に対する正解となる回答を示す。
【0048】
例えば、業務支援タスクが、業務支援システム2において登録されたデータの抽出(例えば、電子メールの差出人のアドレス抽出、電子メールの宛先のアドレス抽出、電子メールの署名に記載された組織及び氏名の抽出、名刺の画像データからの組織及び氏名の抽出)である場合、訓練データの入力部分は、抽出元となるデータを示す。この場合の訓練データの出力部分は、当該データから抽出される正解となる内容を示す。
【0049】
例えば、業務支援タスクが、業務支援システム2において登録されたデータの分類(例えば、スレッド上の話題の分類、電子メールに記載された内容の分類、又は業務支援システム2に登録されたファイルの分類)である場合、訓練データの入力部分は、再学習用のデータを示す。この場合の訓練データの出力部分は、当該データの分類を示す。例えば、業務支援タスクが、業務支援システム2におけるユーザの行動の分析又は予測である場合、訓練データの入力部分は、ユーザの行動を示す。この場合の訓練データの出力部分は、当該行動の分析結果又は予測結果を示す。
【0050】
なお、データ記憶部100に記憶されるデータは、上記の例に限られない。データ記憶部100は、任意のデータを記憶してよい。例えば、データ記憶部100は、大規模言語モデルM1の再学習における一連の処理を示す再学習プログラムを記憶してもよい。ユーザの組織ごとに業務支援モデルM2が作成される場合には、データ記憶部100は、組織ごとの業務支援モデルM2を記憶してもよい。
【0051】
[大規模言語モデル取得部]
大規模言語モデル取得部101は、事前学習済みの大規模言語モデルM1を取得する。本実施形態では、事前学習済みの大規模言語モデルM1がデータ記憶部100に記憶されているので、大規模言語モデル取得部101は、データ記憶部100から、事前学習済みの大規模言語モデルM1を取得する。事前学習済みの大規模言語モデルM1が、再学習端末10以外の他のコンピュータ又は情報記憶媒体に記憶されている場合には、大規模言語モデル取得部101は、他のコンピュータ又は情報記憶媒体から、事前学習済みの大規模言語モデルM1を取得する。
【0052】
[訓練データ取得部]
訓練データ取得部102は、ユーザの業務を支援する業務支援システム2で行われたユーザのアクティビティを示すアクティビティデータに基づいて作成された、大規模言語モデルM1の再学習用の訓練データを取得する。本実施形態では、訓練データが訓練データベースDB1に格納されているので、大規模言語モデル取得部101は、訓練データベースDB1から、訓練データを取得する。訓練データが、再学習端末10以外の他のコンピュータ又は情報記憶媒体に記憶されている場合には、訓練データ取得部102は、他のコンピュータ又は情報記憶媒体から、訓練データを取得する。
【0053】
[再学習部]
再学習部103は、訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、業務支援システム2に特有の業務支援モデルM2を作成する。本実施形態では、再学習部103が、教師有り学習のアルゴリズムに基づいて、大規模言語モデルM1の再学習を実行する場合を例に挙げる。再学習のアルゴリズムは、公知のアルゴリズムであってよい。例えば、再学習部103は、半教師有り学習又は教師無し学習のアルゴリズムに基づいて、大規模言語モデルM1の再学習を実行してもよい。
【0054】
例えば、再学習部103は、教師有り学習のアルゴリズムに基づいて、訓練データの入力部分が大規模言語モデルM1に入力された場合に、訓練データの出力部分が大規模言語モデルM1から出力されるように、大規模言語モデルM1のパラメータを調整することによって、大規模言語モデルM1の再学習を実行する。再学習部103は、公知の損失関数に基づいて、訓練データの入力部分が大規模言語モデルM1に入力された場合の大規模言語モデルM1からの出力と、訓練データの出力部分と、の誤差を示す損失を計算する。再学習部103は、当該計算された損失が小さくなるように、大規模言語モデルM1のパラメータを調整することによって、大規模言語モデルM1の再学習を実行する。再学習部103は、損失が閾値未満になるまで、大規模言語モデルM1の再学習を繰り返し実行してもよい。
【0055】
例えば、再学習中の大規模言語モデルM1は、訓練データの入力部分が示すテキストを、複数のトークンに分割する。大規模言語モデルM1は、複数のトークンの各々をエンコードして埋め込み表現の並びに変換する。大規模言語モデルM1は、埋め込み表現の並びに基づいて、必要に応じてその続きを予測し、業務支援タスクに応じた出力を計算する。大規模言語モデルM1の出力と、訓練データの出力部分と、の違いが大きいほど、損失が大きくなる。大規模言語モデルM1の出力と、訓練データの出力部分と、の違いが小さいほど、損失が小さくなる。これらの一連の処理は、大規模言語モデルM1のプログラム(例えば、エンコーダ、デコーダ、出力層、及びその他の層)と、大規模言語モデルM1の現状のパラメータと、に基づいて実行される。
【0056】
例えば、訓練データの入力部分が、アクティビティデータに応じたテキストを示すものとする。更に、訓練データの出力部分が、当該テキストに応じた正解となるテキストであるものとする。この場合、業務支援タスクは、何らかのテキストに基づく他のテキストの作成のタスクとなる。再学習部103が、大規模言語モデルM1に対し、訓練データの入力部分を入力すると、大規模言語モデルM1は、当該入力部分が示すテキストの埋め込み表現の並びに応じた他のテキストを出力する。再学習部103は、当該他のテキストと、訓練データの出力部分と、の違いに基づいて、大規模言語モデルM1の再学習を実行する。
【0057】
例えば、訓練データの入力部分が、アクティビティデータに基づくテキストを示すものとする。更に、訓練データの出力部分が、当該テキストの正解となる分類であるものとする。この場合、業務支援タスクは、何らかのテキストの分類のタスクとなる。再学習部103が、大規模言語モデルM1に対し、訓練データの入力部分を入力すると、大規模言語モデルM1は、当該入力部分が示すテキストの埋め込み表現の並びに応じた分類の推定結果を出力する。再学習部103は、当該分類の推定結果と、訓練データの出力部分と、の違いに基づいて、大規模言語モデルM1の再学習を実行する。
【0058】
本実施形態では、スレッドのサマリ作成が業務支援タスクに相当する場合を例に挙げるので、再学習部103は、大規模言語モデルM1に対し、訓練データの入力部分であるスレッドデータを入力する。大規模言語モデルM1は、当該スレッドデータが示すスレッドの埋め込み表現の並びに応じたサマリを示すサマリデータを出力する。再学習部103は、当該出力されたサマリデータと、訓練データの出力部分と、の違いに基づいて、大規模言語モデルM1の再学習を実行する。先述した種々の訓練データの例も同様にして、再学習部103は、大規模言語モデルM1に対し、訓練データの入力部分を入力し、大規模言語モデルM1からの出力と、訓練データの出力部分と、の違いに基づいて、大規模言語モデルM1の再学習を実行すればよい。
【0059】
なお、再学習で利用されるアルゴリズムは、公知のアルゴリズムであってよい。例えば、再学習部103は、誤差逆伝播法に基づいて、大規模言語モデルM1の再学習を実行する。再学習部103は、誤差逆伝播法以外の他のアルゴリズムに基づいて、大規模言語モデルM1の再学習を実行してもよい。例えば、再学習部103は、勾配降下法、モーメンタム法、準ニュートン法、共役勾配法、局所探索法、又はその他のアルゴリズムに基づいて、大規模言語モデルM1の再学習を実行してもよい。
【0060】
本実施形態では、再学習部103は、データ記憶部100に記憶された再学習プログラムを実行することによって、再学習の一連の処理を実行する。再学習部103は、再学習が完了した大規模言語モデルM1を、業務支援モデルM2としてデータ記憶部100に記録する。再学習部103は、業務支援サーバ20に対し、業務支援モデルM2を送信する。業務支援サーバ20に送信された業務支援モデルM2は、ユーザの利用に供される。
【0061】
[3-2.業務支援サーバで実現される機能]
例えば、業務支援サーバ20は、データ記憶部200及び業務支援部201を含む。データ記憶部200は、記憶部22により実現される。業務支援部201は、制御部21により実現される。
【0062】
[データ記憶部]
データ記憶部200は、ユーザの業務支援に必要なデータを記憶する。例えば、データ記憶部200は、ユーザデータベースDB2を記憶する。
【0063】
図6は、ユーザデータベースDB2の一例を示す図である。ユーザデータベースDB2は、業務支援システム2を利用するユーザの各種データが格納されたデータベースである。例えば、ユーザデータベースDB2には、ユーザが属する組織の組織ID、ユーザのユーザID、及びアクティビティデータが格納される。ユーザデータベースDB2には、任意のデータが格納されてよい。例えば、ユーザデータベースDB2には、ユーザのログイン用のパスワード等の他のデータが格納されてもよい。
【0064】
組織IDは、業務支援システム2に契約した組織のIDである。ユーザIDは、当該組織に属するユーザのIDである。例えば、ユーザIDは、ユーザが業務支援システム2にログインするためのログインアカウントとして利用される。1つの組織IDには、少なくとも1つのユーザIDが関連付けられる。アクティビティデータは、ユーザのアクティビティを示すデータである。例えば、アクティビティデータは、アクティビティが行われた日時と、アクティビティの具体的な内容と、を示す。
【0065】
本実施形態では、スレッドに対するメッセージの投稿がアクティビティに相当するので、アクティビティデータは、メッセージの具体的な内容であるテキストを示す。アクティビティデータには、ユーザがスレッドにメッセージを投稿した日時、メッセージに対するリアクション、又はその他の情報が含まれてもよい。ある組織のあるユーザがスレッドにメッセージを投稿するたびに、業務支援部201によりアクティビティデータが作成されて、当該組織の組織IDと、当該ユーザのユーザIDと、に関連付けられてアクティビティデータがユーザデータベースDB2に格納される。
【0066】
なお、データ記憶部200に記憶されるデータは、ユーザデータベースDB2に限られない。データ記憶部200は、任意のデータを記憶してよい。例えば、データ記憶部200は、データ記憶部200は、再学習済みの業務支援モデルM2を記憶してもよい。データ記憶部200は、アクティビティデータとは別に、業務支援システム2に登録されたスレッドの内容等の各種データを記憶してもよい。
【0067】
[業務支援部]
業務支援部201は、ユーザの業務を支援するための各種処理を実行する。例えば、業務支援部201は、ユーザ端末30から取得したユーザの操作内容を示す操作データに基づいて、アクティビティデータを作成する。業務支援部201は、当該ユーザのユーザIDと、当該作成されたアクティビティデータと、が互いに関連付けられるように、ユーザデータベースDB2を更新する。業務支援部201は、再学習端末10に対し、ユーザデータベースDB2に格納されたアクティビティデータを送信する。訓練データは、当該アクティビティデータに基づいて作成される。
【0068】
例えば、業務支援部201は、再学習済みの業務支援モデルM2に基づいて、ユーザの業務を支援する。本実施形態では、スレッドのサマリ作成が業務支援タスクに相当する場合を例に挙げるので、業務支援部201は、業務支援モデルM2に対し、ユーザがサマリの作成を希望するスレッドのスレッドデータを入力する。再学習済みの業務支援モデルM2は、スレッドデータが示すスレッドの埋め込み表現を計算する。再学習済みの業務支援モデルM2は、当該計算された埋め込み表現に応じたサマリを示すサマリデータを作成する。業務支援部201は、ユーザ端末30に対し、再学習済みの業務支援モデルM2により作成されたサマリデータを送信する。業務支援部201は、他の業務支援タスクも同様にして、業務支援モデルM2に対し、何らかのテキストを示すデータを入力し、業務支援モデルM2から出力されたデータに基づいて、ユーザの業務を支援する。
【0069】
[3-3.ユーザ端末で実現される機能]
例えば、ユーザ端末30は、データ記憶部300、表示制御部301、及び操作受付部302を含む。データ記憶部300は、記憶部32により実現される。表示制御部301及び操作受付部302は、制御部31により実現される。
【0070】
[データ記憶部]
データ記憶部300は、ユーザが業務支援システム2を利用するために必要なデータを記憶する。例えば、データ記憶部300は、ブラウザを記憶する。例えば、データ記憶部300は、業務支援システム2専用のプログラムを記憶する。
【0071】
[表示制御部]
表示制御部301は、業務支援のための各種画面を、表示部35に表示させる。例えば、表示制御部301は、ブラウザ上で、業務支援システム2における画面を表示させる。表示制御部301は、業務支援システム2専用のプログラム上で、業務支援システム2における画面を表示させる。業務支援モデルM2が作成された後は、ユーザは、業務支援画面SCから、業務支援モデルM2を利用できる。図2の例であれば、ユーザが「サマリを作成する」を選択すると、表示中のスレッドのサマリデータが業務支援モデルM2により作成される。
【0072】
[操作受付部]
操作受付部302は、表示制御部301が表示部35に表示させた各画面に対する操作を受け付ける。操作受付部302は、業務支援サーバ20に対し、ユーザが行った操作内容を示す操作データを送信する。
【0073】
[4.再学習システムで実行される処理]
図7は、再学習システム1で実行される処理の一例を示す図である。制御部11,21,31が、それぞれ記憶部12,22,32に記憶されたプログラムを実行することによって、図7の処理が実行される。
【0074】
図7のように、業務支援サーバ20は、ユーザ端末30から受信した操作データに基づいて、アクティビティデータを作成してユーザデータベースDB2に格納する(S1)。業務支援サーバ20は、再学習端末10に対し、ユーザデータベースDB2に格納されたアクティビティデータを送信する(S2)。再学習端末10は、業務支援サーバ20から、アクティビティデータを受信する(S3)。再学習端末10は、アクティビティデータに基づいて作成された訓練データを、訓練データベースDB1に格納する(S4)。
【0075】
再学習端末10は、記憶部12に記憶された事前学習済みの大規模言語モデルM1を取得する(S5)。再学習端末10は、訓練データベースDB1から、任意の数の訓練データを取得する(S6)。再学習端末10は、S6で取得された訓練データに基づいて、事前学習済みの大規模言語モデルM1を再学習することによって、業務支援モデルM2を作成する(S7)。再学習端末10は、業務支援サーバ20に対し、S7で作成された業務支援モデルM2を送信する(S8)。業務支援サーバ20は、再学習端末10から、業務支援モデルM2を受信する(S9)。業務支援サーバ20は、ユーザ端末30との間で、ユーザに業務支援モデルM2を利用させるための処理を実行し(S10)、本処理は、終了する。
【0076】
[5.実施形態のまとめ]
本実施形態の再学習システム1は、事前学習済みの大規模言語モデルM1を取得する。再学習システム1は、アクティビティデータに基づいて作成された、大規模言語モデルM1の再学習用の訓練データを取得する。再学習システム1は、訓練データに基づいて、大規模言語モデルM1の再学習を実行する。例えば、業務支援システム2の運営会社が、1から業務支援モデルM2を作成するのは現実的ではないが、再学習システム1は、事前学習済みの大規模言語モデルM1の再学習によって、業務支援システム2に有用な業務支援モデルM2を実現できる。例えば、再学習システム1は、汎用的な大規模言語モデルM1に比べて、業務支援システム2におけるユーザのアクティビティが学習された業務支援モデルM2に基づいて、ユーザの業務を効果的に支援できる。大規模言語モデルM1は、基本的な言語解析の能力を有するので、再学習システム1は、少ない訓練データだったとしても、精度の高い業務支援モデルM2を作成できる。
【0077】
[6.変形例]
なお、本開示は、実施形態の例に限定されない。本開示は、本開示の趣旨を逸脱しない範囲で変更可能である。
【0078】
[6-1.変形例1]
実施形態では、再学習用のスレッドデータと、再学習時の正解となるサマリデータと、を含む訓練データを一例として説明した。再学習システム1は、このような1つの観点で作成された訓練データで再学習を実行するよりも、種々の観点で作成された訓練データに基づいて、複数の業務支援モデルM2を作成した方が、より効果的な業務支援が可能になる。そこで、変形例1の再学習システム1は、種々の観点で作成された訓練データに基づいて、多段階の再学習を実行する。
【0079】
変形例1の訓練データ取得部102は、互いに異なる観点で作成された複数の訓練データを取得する。観点とは、訓練データの作成時の基準である。別の言い方をすれば、観点は、訓練データの作成で利用されるアクティビティデータの種類である。変形例1では、互いに異なる観点で作成された複数の訓練データの一例として、業務支援タスクごとに作成される訓練データと、組織ごとに作成される訓練データと、について説明する。これらの観点で作成された訓練データに基づいて、多段階の再学習が実行される。
【0080】
図8は、多段階の再学習の一例を示す図である。変形例1の再学習部103は、変形例1の訓練データ取得部102により取得された複数の訓練データに基づいて、大規模言語モデルM1の多段階の再学習を実行することによって、複数の業務支援モデルM2を作成する。例えば、再学習部103は、ある観点で作成された訓練データに基づいて、1段階目の再学習を実行することによって、1段階目の業務支援モデルM2である共通業務支援モデルM2A1,M2A2を作成する。以降、共通業務支援モデルM2A1,M2A2を区別しない時は、単に共通業務支援モデルM2Aという。共通業務支援モデルM2Aは、1つだけであってもよいし、3つ以上であってもよい。
【0081】
例えば、再学習部103は、他の観点で作成された訓練データに基づいて、2段階目の再学習を実行することによって、2段階目の業務支援モデルM2である特有業務支援モデルM2B1,M2B2を作成する。以降、特有業務支援モデルM2B1,M2B2を区別しない時は、単に共通業務支援モデルM2Bという。共通業務支援モデルM2Bは、1つだけであってもよいし、3つ以上であってもよい。再学習部103は、3段階以上の再学習を実行してもよい。
【0082】
変形例1では、実施形態と同様に、複数の組織の各々に属するユーザが、業務支援システム2を利用するものとする。更に、ユーザデータベースDB2には、複数の組織の各々のユーザのアクティビティデータが格納されているものとする。例えば、訓練データ取得部102は、業務支援モデルM2が行う業務支援タスクごとに、複数の組織の各々のアクティビティデータに基づいて作成された、複数の組織に共通の訓練データである共通訓練データを取得する。
【0083】
例えば、スレッドのサマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。この場合、訓練データ取得部102は、スレッドのサマリ作成を行う共通業務支援モデルM2A1の作成のために、複数の組織の各々のスレッドデータ(アクティビティデータの一例)に基づいて作成された共通訓練データを取得する。例えば、訓練データ取得部102は、機械翻訳を行う共通業務支援モデルM2A2の作成のために、複数の組織の各々に属するユーザが入力した何らかのテキストを示すアクティビティデータに基づいて作成された共通訓練データを取得する。
【0084】
例えば、再学習部103は、業務支援タスクごとに、共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、複数の組織に共通の業務支援モデルM2である共通業務支援モデルM2Aを作成する。変形例1の共通業務支援モデルM2Aは、ある業務支援タスクに特有のモデルではあるが、特定の組織に特有のモデルではない。共通業務支援モデルM2Aは、複数の組織の各々の業務を汎用的に支援できる。共通業務支援モデルM2Aは、後述の特有業務支援モデルM2Bの作成のための中間的なモデルである。共通訓練データに基づく再学習の方法は、実施形態で説明した訓練データに基づく再学習と同様である。
【0085】
例えば、スレッドのサマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。この場合、再学習部103は、複数の組織の各々のスレッドデータ(アクティビティデータの一例)から作成された共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、スレッドのサマリ作成を行う共通業務支援モデルM2A1を作成する。スレッドのサマリ作成を行う共通業務支援モデルM2A1は、大規模言語モデルM1よりもサマリ作成の精度が高いが、特定の組織に特有のサマリ作成を行えるわけではない。
【0086】
例えば、再学習部103は、複数の組織の各々に属するユーザが入力した何らかのテキストを示すアクティビティデータから作成された共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、機械翻訳を行う共通業務支援モデルM2A2を作成する。機械翻訳を行う共通業務支援モデルM2A2は、大規模言語モデルM1よりも機械翻訳の精度が高いが、特定の組織に特有の機械翻訳を行えるわけではない。
【0087】
例えば、訓練データ取得部102は、組織ごとに、当該組織のアクティビティデータに基づいて作成された、当該組織に特有の訓練データである特有訓練データを取得する。変形例1では、特有訓練データの作成に使用されるアクティビティデータと、共通訓練データの作成に使用されるアクティビティデータと、が同じである場合を説明するが、これらは異なってもよい。
【0088】
例えば、スレッドのサマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。この場合、訓練データ取得部102は、ある第1組織に特有のサマリ作成を行う特有業務支援モデルM2B1の作成のために、当該第1組織のスレッドデータに基づいて作成された特有訓練データを取得する。訓練データ取得部102は、他の第2組織に特有のサマリ作成を行う特有業務支援モデルM2B2の作成のために、当該第2組織のスレッドデータに基づいて作成された特有訓練データを取得する。
【0089】
例えば、訓練データ取得部102は、ある第1組織に特有の機械翻訳を行う特有業務支援モデルM2B3の作成のために、当該第1組織に属するユーザが入力した何らかのテキストを示すアクティビティデータに基づいて作成された特有訓練データを取得する。訓練データ取得部102は、他の第2組織に特有の機械翻訳を行う特有業務支援モデルM2B4の作成のために、当該第2組織に属するユーザが入力した何らかのテキストを示すアクティビティデータに基づいて作成された特有訓練データを取得する。
【0090】
例えば、再学習部103は、組織ごとに、当該組織の特有訓練データに基づいて、共通業務支援モデルM2Aの再学習を実行することによって、当該組織に特有の業務支援モデルM2である特有業務支援モデルM2Bを作成する。変形例1の特有業務支援モデルM2Bは、特定の組織の特定の業務支援タスクに特化したモデルである。特有業務支援モデルM2Bは、特定の組織の特定の業務を支援できる。特有業務支援モデルM2Bは、特定の組織に属するユーザに供される最終的なモデルである。特有訓練データに基づく再学習の方法は、実施形態で説明した訓練データに基づく再学習と同様である。
【0091】
例えば、スレッドのサマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。この場合、再学習部103は、第1組織のスレッドデータから作成された特有訓練データに基づいて、サマリ作成の共通業務支援モデルM2A1の再学習を実行することによって、第1組織に特有のサマリ作成を行う特有業務支援モデルM2B1を作成する。再学習部103は、第2組織のスレッドデータから作成された特有訓練データに基づいて、サマリ作成の共通業務支援モデルM2A1の再学習を実行することによって、第2組織に特有のサマリ作成を行う特有業務支援モデルM2B2を作成する。
【0092】
例えば、再学習部103は、第1組織に属するユーザが入力した何らかのテキストを示すアクティビティデータから作成された特有訓練データに基づいて、機械翻訳の共通業務支援モデルM2A2の再学習を実行することによって、第1組織に特有の機械翻訳を行う特有業務支援モデルM2B3を作成する。再学習部103は、第2組織に属するユーザが入力した何らかのテキストを示すアクティビティデータから作成された特有訓練データに基づいて、機械翻訳の共通業務支援モデルM2A2の再学習を実行することによって、第2組織に特有の機械翻訳を行う特有業務支援モデルM2B4を作成する。
【0093】
なお、以上の説明では、業務支援タスクが2つであり、かつ、組織が2つである場合を一例として説明したが、業務支援タスク及び組織は、任意の数であってよい。例えば、業務支援タスクが3つ以上である場合、3つ以上の共通業務支援モデルM2Aが作成されてよい。組織が3つ以上である場合、業務支援タスクごとに、3つ以上の特有業務支援モデルM2Bが作成されてよい。
【0094】
例えば、再学習部103は、複数の組織の各々の特有業務支援モデルM2Bを、データ記憶部100に記録する。再学習部103は、業務支援サーバ20に対し、複数の組織の各々の特有業務支援モデルM2Bを送信する。業務支援サーバ20は、複数の組織の各々の組織IDと、当該組織の特有業務支援モデルM2Bと、を互いに関連付けてデータ記憶部200に記録する。ある組織に属するユーザが業務支援システム2にログインすると、業務支援部201は、当該組織の組織IDに関連付けられた特有業務支援モデルM2Bに基づいて、当該ユーザの業務を支援する。
【0095】
なお、特有業務支援モデルM2Bが作成されていない組織に属するユーザが業務支援システム2にログインした場合には、業務支援部201は、共通業務支援モデルM2Aに基づいて、当該ユーザの業務を支援してもよい。この場合、業務支援部201は、共通業務支援モデルM2Aではなく、他の組織(例えば、業種又は従業員規模が同じ組織)の組織IDに関連付けられた特有業務支援モデルM2Bに基づいて、当該ユーザの業務を支援してもよい。
【0096】
変形例1の再学習システム1は、互いに異なる観点で作成された複数の訓練データを取得する。再学習システム1は、複数の訓練データに基づいて、大規模言語モデルM1の多段階の再学習を実行することによって、複数の業務支援モデルM2を作成する。これにより、再学習システム1は、より有用な業務支援モデルM2を実現できる。例えば、再学習システム1は、多段階の再学習によって、より精度の高い業務支援を実現できる。
【0097】
また、再学習システム1は、業務支援タスクごとに、共通訓練データに基づいて、共通業務支援モデルM2Aを作成する。再学習システム1は、組織ごとに、当該組織の特有訓練データに基づいて、特有業務支援モデルM2Bを作成する。これにより、再学習システム1は、より多くの共通訓練データに基づいて共通業務支援モデルM2Aを作成した後に、個々の組織の傾向に特化した特有業務支援モデルM2Bを作成できるので、個々の組織に特有の業務支援モデルM2を効率良く作成できる。例えば、再学習システム1は、特定の業務支援タスクと、特定の組織と、に応じた精度の高い業務支援を実現できる。
【0098】
[6-2.変形例2]
例えば、変形例1で説明した多段階の再学習の方法は、変形例1で説明した組織に応じた多段階の再学習の方法に限られない。変形例2では、多段階の再学習の他の方法の一例として、業務支援タスク及び業務支援機能に応じた多段階の再学習を説明する。なお、複数の業務支援システム2が存在する場合には、業務支援機能は、ある単一の業務支援システム2が有する機能ではなく、業務支援システム2自体であってもよい。例えば、複数のグループウェアが存在する場合には、個々のグループウェアが業務支援機能に相当してもよい。
【0099】
例えば、訓練データ取得部102は、業務支援モデルM2が行う業務支援タスクごとに、業務支援システム2が有する複数の業務支援機能の各々のアクティビティデータに基づいて作成された、複数の業務支援機能に共通の訓練データである共通訓練データを取得する。
【0100】
例えば、サマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。変形例2のサマリ作成は、スレッドに限られず、業務支援システム2全般のサマリ作成であるものとする。この場合、訓練データ取得部102は、サマリ作成を行う共通業務支援モデルM2A1の作成のために、複数の業務支援機能の各々のアクティビティデータに基づいて作成された、サマリ作成用の共通訓練データを取得する。例えば、訓練データ取得部102は、機械翻訳を行う共通業務支援モデルM2A2の作成のために、複数の業務支援機能の各々のアクティビティデータに基づいて作成された、機械翻訳用の共通訓練データを取得する。
【0101】
例えば、再学習部103は、業務支援タスクごとに、共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、複数の業務支援機能に共通の業務支援モデルM2である共通業務支援モデルM2Aを作成する。変形例2の共通業務支援モデルM2Aは、ある業務支援タスクに特有のモデルではあるが、特定の業務支援機能に特有のモデルではない。共通業務支援モデルM2Aは、複数の業務支援機能の各々を利用するユーザの業務を汎用的に支援できる。共通業務支援モデルM2Aは、後述の特有業務支援モデルM2Bの作成のための中間的なモデルである。共通訓練データに基づく再学習の方法は、実施形態で説明した訓練データに基づく再学習と同様である。
【0102】
例えば、サマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。この場合、再学習部103は、複数の業務支援機能の各々のアクティビティデータから作成された、サマリ作成用の共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、サマリ作成を行う共通業務支援モデルM2A1を作成する。サマリ作成を行う共通業務支援モデルM2A1は、大規模言語モデルM1よりもサマリ作成の精度が高いが、特定の業務支援機能に特有のサマリ作成を行えるわけではない。
【0103】
例えば、再学習部103は、複数の業務支援機能の各々のアクティビティデータから作成された、機械翻訳用の共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、機械翻訳を行う共通業務支援モデルM2A1を作成する。機械翻訳を行う共通業務支援モデルM2A2は、大規模言語モデルM1よりも機械翻訳の精度が高いが、特定の業務支援機能に特有の機械翻訳を行えるわけではない。
【0104】
例えば、訓練データ取得部102は、業務支援機能ごとに、当該業務支援機能のアクティビティデータに基づいて作成された、当該業務支援機能に特有の訓練データである特有訓練データを取得する。変形例2では、変形例1と同様に、特有訓練データの作成に使用されるアクティビティデータと、共通訓練データの作成に使用されるアクティビティデータと、が同じである場合を説明するが、これらは異なってもよい。
【0105】
例えば、サマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。更に、スレッド機能と、メール管理機能と、の2つの業務支援機能が存在したとする。この場合、訓練データ取得部102は、スレッド機能に特有のサマリ作成を行う特有業務支援モデルM2B1の作成のために、スレッドデータに基づいて作成された特有訓練データを取得する。訓練データ取得部102は、メール管理機能に特有のサマリ作成を行う特有業務支援モデルM2B2の作成のために、メール管理機能で管理されるメールの本文を示すアクティビティデータに基づいて作成された特有訓練データを取得する。
【0106】
例えば、訓練データ取得部102は、スレッド機能に特有の機械翻訳を行う特有業務支援モデルM2B3の作成のために、スレッドデータに基づいて作成された特有訓練データを取得する。訓練データ取得部102は、メール管理機能に特有の機械翻訳を行う特有業務支援モデルM2B4の作成のために、メール管理機能で管理されるメールの本文を示すアクティビティデータに基づいて作成された特有訓練データを取得する。
【0107】
例えば、再学習部103は、業務支援機能ごとに、当該業務支援機能の特有訓練データに基づいて、共通業務支援モデルM2Aの再学習を実行することによって、当該業務支援機能に特有の業務支援モデルM2である特有業務支援モデルM2Bを作成する。変形例2の特有業務支援モデルM2Bは、特定の業務支援機能の特定の業務支援タスクに特化したモデルである。特有業務支援モデルM2Bは、特定の業務支援機能を利用するユーザの業務を支援できる。特有業務支援モデルM2Bは、特定の業務支援機能を利用するユーザに供される最終的なモデルである。特有訓練データに基づく再学習の方法は、実施形態で説明した訓練データに基づく再学習と同様である。
【0108】
例えば、サマリ作成と、機械翻訳と、の2つ業務支援タスクが存在したとする。更に、スレッド機能と、メール管理機能と、の2つの業務支援機能が存在したとする。この場合、再学習部103は、スレッドデータから作成された特有訓練データに基づいて、サマリ作成の共通業務支援モデルM2A1の再学習を実行することによって、スレッド機能に特有のサマリ作成を行う特有業務支援モデルM2B1を作成する。再学習部103は、メール管理機能を利用するユーザのアクティビティデータから作成された特有訓練データに基づいて、サマリ作成の共通業務支援モデルM2A1の再学習を実行することによって、メール管理機能に特有のサマリ作成を行う特有業務支援モデルM2B2を作成する。
【0109】
例えば、再学習部103は、スレッドデータから作成された特有訓練データに基づいて、機械翻訳の共通業務支援モデルM2A2の再学習を実行することによって、スレッド機能に特有の機械翻訳を行う特有業務支援モデルM2B3を作成する。再学習部103は、メール管理機能を利用するユーザのアクティビティデータから作成された特有訓練データに基づいて、機械翻訳の共通業務支援モデルM2A2の再学習を実行することによって、メール管理機能に特有の機械翻訳を行う特有業務支援モデルM2B4を作成する。
【0110】
なお、以上の説明では、業務支援タスクが2つであり、かつ、業務支援機能が2つである場合を一例として説明したが、業務支援タスク及び業務支援機能は、任意の数であってよい。例えば、業務支援タスクが3つ以上である場合、3つ以上の共通業務支援モデルM2Aが作成されてよい。業務支援機能が3つ以上である場合、業務支援タスクごとに、3つ以上の特有業務支援モデルM2Bが作成されてよい。
【0111】
例えば、再学習部103は、複数の業務支援機能の各々の特有業務支援モデルM2Bを、データ記憶部100に記録する。再学習部103は、業務支援サーバ20に対し、複数の業務支援機能の各々の特有業務支援モデルM2Bを送信する。業務支援サーバ20は、複数の業務支援機能の各々と、当該業務支援機能の特有業務支援モデルM2Bと、を互いに関連付けてデータ記憶部200に記録する。ある業務支援機能をユーザが利用する場合、業務支援部201は、当該業務支援機能に関連付けられた特有業務支援モデルM2Bに基づいて、当該ユーザの業務を支援する。
【0112】
なお、特有業務支援モデルM2Bが作成されていない業務支援機能をユーザが利用する場合には、業務支援部201は、共通業務支援モデルM2Aに基づいて、当該ユーザの業務を支援してもよい。この場合、業務支援部201は、共通業務支援モデルM2Aではなく、他の業務支援機能に関連付けられた特有業務支援モデルM2Bに基づいて、当該ユーザの業務を支援してもよい。
【0113】
変形例2の再学習システム1は、業務支援タスクごとに、共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、共通業務支援モデルM2Aを作成する。再学習システム1は、業務支援機能ごとに、当該業務支援機能の特有訓練データに基づいて、共通業務支援モデルM2Aの再学習を実行することによって、当該業務支援機能に特有の業務支援モデルM2である特有業務支援モデルM2Bを作成する。これにより、再学習システム1は、より多くの共通訓練データに基づいて共通業務支援モデルM2Aを作成した後に、個々の業務支援機能の傾向に特化した特有業務支援モデルM2Bを作成できるので、個々の業務支援機能に特有の業務支援モデルM2を効率良く作成できる。例えば、再学習システム1は、特定の業務支援タスクと、特定の業務支援機能と、に応じた精度の高い業務支援を実現できる。
【0114】
[6-3.変形例3]
例えば、変形例3では、変形例1で説明した多段階の再学習の他の例として、業務支援機能及び組織に応じた多段階の再学習を説明する。変形例3の業務支援タスクは、1つであってもよい。
【0115】
例えば、訓練データ取得部102は、業務支援システム2が有する業務支援機能ごとに、複数の組織の各々のアクティビティデータに基づいて作成された、複数の組織に共通の訓練データである共通訓練データを取得する。
【0116】
例えば、スレッド機能と、メール管理機能と、の2つの業務支援機能が存在したとする。この場合、訓練データ取得部102は、スレッド機能用の共通業務支援モデルM2A1の作成のために、複数の組織の各々に属するユーザがスレッド機能で入力したテキストを示すアクティビティデータに基づいて作成された共通訓練データを取得する。例えば、訓練データ取得部102は、メール管理機能用の共通業務支援モデルM2A2の作成のために、複数の組織の各々に属するユーザがメール管理機能で入力したテキストを示すアクティビティデータに基づいて作成された共通訓練データを取得する。
【0117】
例えば、再学習部103は、業務支援機能ごとに、共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、複数の組織に共通の共通業務支援モデルM2Aを作成する。変形例3の共通業務支援モデルM2Aは、業務支援システム2に特化したモデルではあるが、特定の組織に特有のモデルではない。共通業務支援モデルM2Aは、複数の組織の各々の業務を汎用的に支援できる。共通業務支援モデルM2Aは、後述の特有業務支援モデルM2Bの作成のための中間的なモデルである。共通訓練データに基づく再学習の方法は、実施形態で説明した訓練データに基づく再学習と同様である。
【0118】
例えば、スレッド機能と、メール管理機能と、の2つの業務支援機能が存在したとする。この場合、再学習部103は、複数の組織の各々のアクティビティデータ(ユーザがスレッド機能で入力したテキストを示すアクティビティデータ)から作成された共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、スレッド機能用の共通業務支援モデルM2A1を作成する。スレッド機能用の共通業務支援モデルM2A1は、大規模言語モデルM1よりもスレッド機能に特有の業務支援が可能であるが、特定の組織に特有の業務支援を行えるわけではない。
【0119】
例えば、再学習部103は、複数の組織の各々のアクティビティデータ(ユーザがメール管理機能で入力したテキストを示すアクティビティデータ)から作成された共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、メール管理機能用の共通業務支援モデルM2A2を作成する。メール管理機能用の共通業務支援モデルM2A2は、大規模言語モデルM1よりもメール管理機能に特有の業務支援が可能であるが、特定の組織に特有の業務支援を行えるわけではない。
【0120】
例えば、訓練データ取得部102は、組織ごとに、当該組織のアクティビティに基づいて作成された、当該組織に特有の訓練データである特有訓練データを取得する。変形例3では、特有訓練データの作成に使用されるアクティビティデータと、共通訓練データの作成に使用されるアクティビティデータと、が同じである場合を説明するが、これらは異なってもよい。
【0121】
例えば、スレッド機能と、メール管理機能と、の2つの業務支援機能が存在したとする。この場合、訓練データ取得部102は、ある第1組織のスレッド機能用の特有業務支援モデルM2B1の作成のために、当該第1組織のアクティビティデータに基づいて作成された特有訓練データを取得する。訓練データ取得部102は、他の第2組織のスレッド機能用の特有業務支援モデルM2B2の作成のために、当該第2組織のアクティビティデータに基づいて作成された特有訓練データを取得する。
【0122】
例えば、訓練データ取得部102は、ある第1組織のメール管理機能用の特有業務支援モデルM2B3の作成のために、当該第1組織のアクティビティデータに基づいて作成された特有訓練データを取得する。訓練データ取得部102は、他の第2組織のメール管理機能用の特有業務支援モデルM2B4の作成のために、当該第2組織のアクティビティデータに基づいて作成された特有訓練データを取得する。
【0123】
例えば、再学習部103は、組織ごとに、当該組織の特有訓練データに基づいて、共通業務支援モデルM2Aの再学習を実行することによって、当該組織に特有の業務支援モデルM2である特有業務支援モデルM2Bを作成する。変形例3の特有業務支援モデルM2Bは、特定の組織に特化したモデルである。特有業務支援モデルM2Bは、特定の組織に属するユーザが特定の業務支援機能を利用するためのモデルである。特有業務支援モデルM2Bは、特定の組織に属するユーザに供される最終的なモデルである。特有訓練データに基づく再学習の方法は、実施形態で説明した訓練データに基づく再学習と同様である。
【0124】
例えば、スレッド機能と、メール管理機能と、の2つの業務支援機能が存在したとする。この場合、再学習部103は、第1組織のアクティビティデータから作成された特有訓練データに基づいて、スレッド機能用の共通業務支援モデルM2A1の再学習を実行することによって、第1組織に特有の業務支援が可能な特有業務支援モデルM2B1を作成する。再学習部103は、第2組織のアクティビティデータから作成された特有訓練データに基づいて、スレッド機能用の共通業務支援モデルM2A1の再学習を実行することによって、第2組織に特有の業務支援が可能な特有業務支援モデルM2B2を作成する。
【0125】
例えば、再学習部103は、第1組織のアクティビティデータから作成された特有訓練データに基づいて、メール管理機能用の共通業務支援モデルM2A2の再学習を実行することによって、第1組織に特有の業務支援が可能な特有業務支援モデルM2B3を作成する。再学習部103は、第2組織のアクティビティデータから作成された特有訓練データに基づいて、メール管理機能用の共通業務支援モデルM2A2の再学習を実行することによって、第2組織に特有の業務支援が可能な特有業務支援モデルM2B4を作成する。
【0126】
なお、以上の説明では、業務支援機能が2つであり、かつ、組織が2つである場合を一例として説明したが、業務支援機能及び組織は、任意の数であってよい。例えば、業務支援機能が3つ以上である場合、3つ以上の共通業務支援モデルM2Aが作成されてよい。組織が3つ以上である場合、業務支援機能ごとに、3つ以上の特有業務支援モデルM2Bが作成されてよい。
【0127】
例えば、再学習部103は、複数の組織の各々の特有業務支援モデルM2Bを、データ記憶部100に記録する。再学習部103は、業務支援サーバ20に対し、複数の組織の各々の特有業務支援モデルM2Bを送信する。業務支援サーバ20は、複数の組織の各々の組織IDと、当該組織の特有業務支援モデルM2Bと、を互いに関連付けてデータ記憶部200に記録する。ある組織に属するユーザがある業務支援機能を利用する場合に、業務支援部201は、当該組織の組織IDに関連付けられた、当該業務支援機能用の特有業務支援モデルM2Bに基づいて、当該ユーザの業務を支援する。
【0128】
なお、特有業務支援モデルM2Bが作成されていない組織に属するユーザが業務支援システム2にログインした場合には、業務支援部201は、共通業務支援モデルM2Aに基づいて、当該ユーザの業務を支援してもよい。この場合、業務支援部201は、共通業務支援モデルM2Aではなく、他の組織(例えば、業種又は従業員規模が同じ組織)の組織IDに関連付けられた特有業務支援モデルM2Bに基づいて、当該ユーザの業務を支援してもよい。
【0129】
変形例3の再学習システム1は、共通訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、共通業務支援モデルM2Aを作成する。再学習システム1は、組織ごとに、当該組織の特有訓練データに基づいて、共通業務支援モデルM2Aの再学習を実行することによって、特有業務支援モデルM2Bを作成する。これにより、再学習システム1は、より多くの共通訓練データに基づいて共通業務支援モデルM2Aを作成した後に、特定の業務支援機能を利用するユーザが属する個々の組織の傾向に特化した特有業務支援モデルM2Bを作成できるので、個々の組織に特有の業務支援モデルM2を効率良く作成できる。例えば、再学習システム1は、特定の業務支援機能と、特定の組織と、に応じた精度の高い業務支援を実現できる。
【0130】
[6-4.変形例4]
例えば、変形例1~3では、共通業務支援モデルM2A及び特有業務支援モデルM2Bといった複数の業務支援モデルM2が作成される。これらの複数の業務支援モデルM2の各々は、訓練データのデータ拡張で利用されてもよい。
【0131】
図9は、変形例4で実現される機能の一例を示す図である。例えば、変形例4の再学習端末10は、訓練データ作成部104を含む。訓練データ作成部104は、制御部11により実現される。訓練データ作成部104は、複数の訓練データの各々と、複数の業務支援モデルM2の各々と、に基づいて、新たな訓練データを作成する。例えば、訓練データ作成部104は、複数の業務支援モデルM2の各々に対し、業務支援モデルM2の再学習で利用された訓練データの入力部分を入力する。業務支援モデルM2は、当該入力部分に応じた出力を行う。
【0132】
例えば、訓練データ作成部104は、業務支援モデルM2に入力された訓練データの入力部分を、新たな訓練データの入力部分として取得する。訓練データ作成部104は、業務支援モデルM2からの出力を、新たな訓練データの出力部分として取得する。新たな訓練データの出力は、業務支援モデルM2からの出力そのものでなくてもよい。例えば、業務支援モデルM2からの出力の一部が変更されたデータが、新たな訓練データの出力部分であってもよい。訓練データ作成部104は、入力部分及び出力部分のペアを、新たな訓練データとして作成する。訓練データ作成部104は、訓練データベースDB1に、新たな訓練データを格納する。
【0133】
変形例4の再学習部103は、新たな訓練データに基づいて、複数の業務支援モデルM2の少なくとも1つの更なる再学習を実行する。再学習部103は、新たな訓練データに基づいて、全ての業務支援モデルM2の再学習を実行してもよいし、一部の業務支援モデルM2の再学習だけを実行してもよい。更なる再学習は、新たな訓練データが利用される点で、実施形態及び変形例1~3の再学習とは異なるが、再学習の方法は、実施形態及び変形例1~3と同様であってよい。
【0134】
変形例4の再学習システム1は、複数の訓練データの各々と、複数の業務支援モデルM2の各々と、に基づいて、新たな訓練データを作成する。再学習システム1は、新たな訓練データに基づいて、複数の業務支援モデルM2の少なくとも1つの更なる再学習を実行する。これにより、再学習システム1は、複数の業務支援モデルM2の各々を利用したデータ拡張を実現できるので、効果的な再学習を実現できる。
【0135】
[6-5.変形例5]
例えば、再学習システム1は、ある特定の組織に特有の業務支援モデルM2を作成しようとしても、その組織に、十分な量のアクティビティデータが存在しないことがある。このため、ある組織に特有の業務支援モデルM2の作成のために、他の組織のアクティビティデータが利用されてもよい。変形例5では、業務支援モデルM2の作成対象となる組織を、第1組織という。第1組織に特有の業務支援モデルM2の作成でアクティビティデータが利用される他の組織を、第2組織という。
【0136】
変形例5の訓練データ取得部102は、第1組織のアクティビティデータに基づいて作成された訓練データである第1組織訓練データと、第1組織と関連する第2組織のアクティビティデータに基づいて作成された訓練データである第2組織訓練データと、を取得する。第2組織は、第1組織と関連付けられた他の組織である。例えば、第2組織は、業種又は従業員規模が第1組織と同じ他の組織である。
【0137】
変形例5の訓練データベースDB1には、個々の訓練データに、当該訓練データの作成で利用されたアクティビティデータが示すアクティビティを行ったユーザが属する組織の組織IDが関連付けられているものとする。更に、第1組織と第2組織の関連付けは、データ記憶部100に定義されているものとする。例えば、第2組織が第1組織と同じ業種の他の組織だったとすると、個々の組織の業種がデータ記憶部100に定義されている。第2組織が第1組織と同じ従業員規模の他の組織だったとすると、個々の組織の従業員規模がデータ記憶部100に定義されている。
【0138】
変形例5の再学習部103は、第1組織訓練データと、第2組織訓練データと、に基づいて、第1組織に特有の業務支援モデルM2を作成する。例えば、再学習部103は、第1組織訓練データと、第2組織訓練データと、に基づいて、大規模言語モデルM1の再学習を実行することによって、第1組織に特有の業務支援モデルM2を作成する。変形例1~3のように、共通業務支援モデルM2Aが作成される場合には、再学習部103は、第1組織訓練データと、第2組織訓練データと、に基づいて、共通業務支援モデルM2Aの再学習を実行することによって、第1組織の特有業務支援モデルM2Bを作成する。
【0139】
変形例5の再学習システム1は、第1組織訓練データと、第2組織訓練データと、に基づいて、第1組織に特有の業務支援モデルM2を作成する。これにより、再学習システム1は、第1組織に特有の業務支援モデルM2を、効率良く作成できる。例えば、第1組織が業務支援システム2に新規登録した組織であり、十分な量のアクティビティデータが存在しなかったとしても、再学習システム1は、第2組織のアクティビティデータに基づく第2組織訓練データを利用するので、第1組織に特有の業務支援モデルM2の精度を高めることができる。
【0140】
[6-6.変形例6]
例えば、変形例5の第2組織は、第1組織よりも業務支援システム2の利用期間が長い他の組織であってもよい。変形例6のデータ記憶部100は、個々の組織の利用期間を示すデータを記憶する。再学習端末10は、当該データを参照することによって、どの組織が第2組織に該当するかを特定できる。
【0141】
変形例6の訓練データ取得部102は、業務支援システム2に新規登録した第1組織の第1組織訓練データと、第1組織よりも業務支援システム2の利用期間が長い第2組織の第2組織訓練データと、を取得する。訓練データ取得部102は、第1組織よりも業務支援システム2の利用期間が短い他の組織のアクティビティデータに基づいては、第1組織に特有の業務支援モデルM2の作成のための訓練データを取得しない。
【0142】
変形例6の再学習部103は、業務支援システム2に新規登録した第1組織に特有の業務支援モデルM2を作成する。再学習部103は、第1組織よりも業務支援システム2の利用期間が短い他の組織のアクティビティデータに基づく訓練データを利用せずに、第1組織よりも業務支援システム2の利用期間が長い第2組織の第2組織訓練データに基づいて、第1組織に特有の業務支援モデルM2を作成する。第2組織訓練データの取得方法が変形例5とは異なるが、第1組織訓練データ及び第2組織訓練データに基づく再学習の方法は、変形例5と同様である。
【0143】
変形例6の再学習システム1は、業務支援システム2に新規登録した第1組織の第1組織訓練データと、第1組織よりも業務支援システム2の利用期間が長い第2組織の第2組織訓練データと、に基づいて、業務支援システム2に新規登録した第1組織に特有の業務支援モデルM2を作成する。利用期間が長いほどアクティビティデータが多いことがあるので、再学習システム1は、業務支援システム2に新規登録した第1組織に特有の業務支援モデルM2を、効率良く作成できる。
【0144】
[6-7.変形例7]
例えば、業務支援モデルM2には、処理対象となるアクティビティデータ以外の他のデータが入力されてもよい。変形例7では、実施形態と同様に、業務支援タスクがスレッドのサマリ作成である場合を例に挙げる。例えば、スレッドには、ユーザがサマリに含めたいと思うキーワードが存在することがある。この場合、サマリの作成対象となるスレッドのスレッドデータだけではなく、ユーザが指定したキーワードが業務支援モデルM2に入力されてもよい。変形例7では、このような入力に対応可能な業務支援モデルM2が作成される。
【0145】
変形例7の訓練データ取得部102は、アクティビティデータが示すアクティビティの全体と、アクティビティデータの中から選択された一部分と、示す訓練データを取得する。アクティビティデータの中から選択された一部分は、再学習が特に必要な部分である。例えば、業務支援システム2の運営会社は、アクティビティの全体の中から一部分を選択してアノテーションを行う。訓練データの入力部分は、アクティビティデータが示すアクティビティの全体と、アノテーションされた一部分と、のペアになる。訓練データの出力部分は、実施形態と同様であってよい。
【0146】
変形例7の再学習部103は、上記全体及び上記一部分を示す訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、業務支援モデルM2を作成する。訓練データの入力部分が実施形態とは異なるが、再学習の方法は、実施形態と同様である。再学習部103は、訓練データの入力部分が示す上記全体及び上記一部分が大規模言語モデルM1に入力された場合に、大規模言語モデルM1が訓練データの出力部分を出力するように、大規模言語モデルM1の再学習を実行する。
【0147】
例えば、ユーザが業務支援モデルM2を利用する場合には、ユーザは、当該一部分に相当する部分を指定する。業務支援タスクがスレッドのサマリ作成である場合には、業務支援部201は、サマリの作成対象となるスレッドのスレッドデータと、当該スレッドの中からユーザが指定したキーワードと、を業務支援モデルM2に入力する。業務支援モデルM2は、これらのテキストの埋め込み表現に基づいて、サマリデータを出力する。当該サマリデータが示すサマリには、ユーザが指定したキーワードが含まれる。
【0148】
なお、アクティビティデータの中から選択される一部分は、上記の例に限られない。当該一部分は、業務支援タスクに応じた部分であってよい。例えば、業務支援タスクが質問に対する回答の作成であれば、当該一部分は、質問の内容であってもよい。業務支援タスクがテキストの作成であれば、当該一部分は、テキストに含まれるべきキーワードであってもよい。その他、当該一部分は、訓練データの出力部分との間に何らかの相関関係があるものであればよい。
【0149】
変形例7の再学習システム1は、アクティビティデータが示すアクティビティの全体と、アクティビティデータの中から選択された一部分と、示す訓練データを取得する。再学習システム1は、全体及び一部分を示す訓練データに基づいて、大規模言語モデルM1の再学習を実行することによって、業務支援モデルM2を作成する。これにより、再学習システム1は、より柔軟な業務支援モデルM2を作成できる。
【0150】
[6-8.その他の変形例]
例えば、上記変形例を組み合わせてもよい。
【0151】
例えば、再学習端末10で実現されるものとして説明した機能は、業務支援サーバ20によって実現されてもよい。再学習端末10で実現されるものとして説明した機能は、複数のコンピュータで分担されてもよい。
【符号の説明】
【0152】
1 再学習システム、2 業務支援システム、10 再学習端末、11,21,31 制御部、12,22,32 記憶部、13,23,33 通信部、20 業務支援サーバ、30 ユーザ端末、14,34 操作部、15,35 表示部、N ネットワーク、100 データ記憶部、101 大規模言語モデル取得部、102 訓練データ取得部、103 再学習部、104 訓練データ作成部、200 データ記憶部、201 業務支援部、300 データ記憶部、301 表示制御部、302 操作受付部、DB1 訓練データベース、DB2 ユーザデータベース、M1 大規模言語モデル、M2 業務支援モデル、M2A,M2A1,M2A2 共通業務支援モデル、M2B,M2B1,M2B2,M2B3,M2B4 特有業務支援モデル、SC 業務支援画面。
【要約】
【課題】業務支援システムに有用な大規模言語モデルを実現する。
【解決手段】再学習システム(1)の大規模言語モデル取得部(101)は、事前学習済みの大規模言語モデルを取得する。訓練データ取得部(102)は、ユーザの業務を支援する業務支援システムで行われたユーザのアクティビティを示すアクティビティデータに基づいて作成された、大規模言語モデルの再学習用の訓練データを取得する。再学習部(103)は、訓練データに基づいて、大規模言語モデルの再学習を実行することによって、業務支援システムに特有の業務支援モデルを作成する。
【選択図】図4
図1
図2
図3
図4
図5
図6
図7
図8
図9