(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】ダッシュボードシステムおよびプログラム
(51)【国際特許分類】
G06Q 10/0637 20230101AFI20240806BHJP
G06F 40/279 20200101ALI20240806BHJP
【FI】
G06Q10/0637
G06F40/279
(21)【出願番号】P 2023188046
(22)【出願日】2023-11-01
【審査請求日】2023-12-04
(73)【特許権者】
【識別番号】596108508
【氏名又は名称】株式会社大和総研
(74)【代理人】
【識別番号】100114638
【氏名又は名称】中野 寛也
(72)【発明者】
【氏名】參木 裕之
(72)【発明者】
【氏名】栗山 太吾
(72)【発明者】
【氏名】堺 光之介
【審査官】塩田 徳彦
(56)【参考文献】
【文献】特開2023-043426(JP,A)
【文献】特開2022-190557(JP,A)
【文献】特開2021-026413(JP,A)
【文献】米国特許出願公開第2017/0293680(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 40/279
(57)【特許請求の範囲】
【請求項1】
健康経営を含む人的資本経営に関する情報を提示するコンピュータにより構成されたダッシュボードシステムであって、
健康経営を含む人的資本経営に関する調査で課題として挙げられたテーマに対する各企業の回答データを含む健康経営度調査票データまたはその他の調査票データについて、前記各企業の回答データのそれぞれを文に分割し、分割して得られた複数の回答文データを用いて、前記テーマ毎に、ソフトクラスタリングまたはニューラル言語モデルにより、前記テーマについての複数のトピックを推定するトピック推定処理を実行することにより、前記回答文データの各々における各トピックの出現確率を示すトピック値を求め、前記複数のトピックの各々について、前記複数の回答文データの中から、前記トピック値が大きい予め定められた件数の上位の前記回答文データを選択抽出し、選択抽出した上位の複数件の前記回答文データのそれぞれをベクトル化して得られた複数の回答文ベクトルを用いて、それぞれのトピックを表現するトピックベクトルを求めるトピックベクトル算出処理を実行し、得られたトピックベクトルを、前記テーマの中の前記トピックを示すサブテーマを識別するサブテーマ識別情報と関連付けて記憶するサブテーマ情報記憶手段と、
前記調査票データとは異なり、前記各企業が企業毎の自由な記載形式で自社に関する健康経営を含む人的資本経営に関する情報を記載した前記各企業の統合報告書データまたはその他の企業文書データについて、前記各企業の企業文書データのそれぞれを文に分割し、分割して得られた複数の企業文データを、企業を識別する企業識別情報、および企業文データを識別する企業文識別情報と関連付けて記憶する企業文データ記憶手段と、
前記サブテーマ毎に、前記回答文データのベクトル化処理で使用した方法と同じ方法によるベクトル化処理により前記複数の企業文データのそれぞれをベクトル化して得られた複数の企業文ベクトルと、前記サブテーマ情報記憶手段に記憶された各サブテーマの前記トピックベクトルとの類似度を算出することにより、前記複数の企業文データのそれぞれについての各サブテーマに対する関連スコアを求める処理を実行する類似度算出手段と、
この類似度算出手段により求めた各サブテーマに対する前記関連スコアを、前記サブテーマ識別情報、前記企業識別情報、および前記企業文識別情報と関連付けて記憶する関連スコア記憶手段と、
この関連スコア記憶手段に記憶された前記各企業の前記企業文データについての前記各サブテーマに対する前記関連スコアを用いて、前記企業文データ記憶手段に記憶された前記企業文データを画面表示する処理を実行する出力手段と
を備えたことを特徴とするダッシュボードシステム。
【請求項2】
前記サブテーマ毎に、前記関連スコア記憶手段に記憶された各サブテーマに対する前記関連スコアを用いて、同一の前記企業識別情報に関連付けられた複数の前記関連スコアのうちの最大値の前記関連スコアを抽出し、抽出した前記関連スコアを当該企業識別情報の企業の代表関連スコアとするか、または、値が大きい上位の複数の前記関連スコアを抽出し、抽出した上位の複数の前記関連スコアを用いて算出した平均値またはその他の演算値を当該企業識別情報の企業の代表関連スコアとする処理を実行する代表関連スコア算出手段を備え、
前記出力手段は、
縦横にセルを配置して形成された行列状の表示部の一方の軸を前記各サブテーマとし、他方の軸を前記各企業とし、各セルの表示色の濃さを、前記代表関連スコア算出手段により求めた前記代表関連スコアの大きさに対応させた俯瞰図を画面表示する俯瞰図表示処理を実行する構成とされている
ことを特徴とする請求項1に記載のダッシュボードシステム。
【請求項3】
前記トピック推定処理を実行するトピック推定手段と、
このトピック推定手段により前記テーマ毎に前記トピック推定処理を実行して得られた前記テーマの中の各トピックにおける各単語の出現確率を、前記テーマ毎に記憶するトピックモデル記憶手段と、
このトピックモデル記憶手段に記憶された前記テーマ毎の各トピックにおける各単語の出現確率の中から、前記テーマ毎で、かつ、前記トピック毎に出現確率の高い予め定められた個数の上位の単語を抽出し、抽出した複数の単語およびこれらの複数の単語を用いてサブテーマ名を作成して欲しい旨の依頼文を記載した前記テーマ毎で、かつ、前記トピック毎のサブテーマ名作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデルに入力し、この大規模言語モデルから出力された前記サブテーマ名を、前記サブテーマ識別情報と関連付けて前記サブテーマ情報記憶手段に記憶させるサブテーマ名取得手段とを備え、
前記出力手段は、
ユーザによる前記サブテーマ毎の情報表示要求を受け付ける際、または、前記サブテーマ毎の情報表示を行う際に、前記サブテーマ情報記憶手段に記憶された前記サブテーマ名を用いる処理を実行する構成とされている
ことを特徴とする請求項1に記載のダッシュボードシステム。
【請求項4】
前記出力手段は、
ユーザによる前記サブテーマの選択、および複数の企業の選択を受け付け、選択された複数の企業の各々について、前記複数の企業文データの中から、選択された前記サブテーマに対する前記関連スコアが高い上位の前記企業文データを選択抽出し、選択抽出した前記企業文データを、企業毎にまとめてリストにして対比する状態で、前記企業識別情報とともに、または、前記企業識別情報および前記関連スコアとともに画面表示する企業間取組比較リスト表示処理を実行する構成とされている
ことを特徴とする請求項1に記載のダッシュボードシステム。
【請求項5】
前記出力手段による前記企業間取組比較リスト表示処理を実行する際に、選択抽出された企業毎の上位の複数の企業文データおよびこれらの複数の企業文データを用いて企業の取り組みを示す複数の取組文をリスト形式で作成して欲しい旨の依頼文を記載した企業取組文作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデルに入力し、この大規模言語モデルから前記複数の取組文をリスト形式で出力させる企業取組文取得手段を備え、
前記出力手段は、
前記企業間取組比較リスト表示処理として、前記企業取組文取得手段により取得した前記複数の取組文を、リスト形式で、企業毎の上位の複数の企業文データと対応させて画面表示する処理も実行する構成とされている
ことを特徴とする請求項4に記載のダッシュボードシステム。
【請求項6】
前記出力手段は、
ユーザによる任意の検索用文字列の入力を受け付け、入力された検索用文字列データを前記回答文データのベクトル化処理で使用した方法と同じ方法によるベクトル化処理によりベクトル化し、得られた検索用文字列ベクトルと、前記企業文データ記憶手段に記憶された前記複数の企業文データをベクトル化した前記複数の企業文ベクトルのそれぞれとの類似度を算出することにより、前記複数の企業文データのそれぞれについての前記検索用文字列データに対する入力文字列関連スコアを求め、求めた入力文字列関連スコアが高い順に、前記企業文データを並べて表示する類似文検索処理を実行する構成とされている
ことを特徴とする請求項1に記載のダッシュボードシステム。
【請求項7】
前記出力手段は、
前記検索用文字列ベクトルと、前記サブテーマ情報記憶手段に記憶された複数の前記サブテーマについての前記トピックベクトルとの類似度を算出することにより、前記検索用文字列ベクトルに対する類似度が予め定められた閾値よりも大きいか若しくは閾値以上の前記トピックベクトルのサブテーマを抽出するか、または、類似度の大きさが予め定められた件数の上位の前記トピックベクトルのサブテーマを抽出し、抽出したサブテーマを画面表示してユーザに提示する類似サブテーマ表示処理を実行する構成とされている
ことを特徴とする請求項6に記載のダッシュボードシステム。
【請求項8】
前記出力手段は、
前記入力文字列関連スコアと、
前記類似サブテーマ表示処理により提示された少なくとも1つのサブテーマの中からユーザにより選択された少なくとも1つのサブテーマの前記サブテーマ識別情報に関連付けられて前記関連スコア記憶手段に記憶された前記関連スコアとを用いて、
前記複数の企業文データのそれぞれについて、前記入力文字列関連スコアおよび少なくとも1つの前記関連スコアを用いてこれらの平均値若しくは加重平均値またはその他の演算値を求め、これを統合関連スコアとし、
この統合関連スコアの高い順に、前記企業文データを並べ替えて表示する統合関連スコア順表示処理を実行する構成とされている
ことを特徴とする請求項7に記載のダッシュボードシステム。
【請求項9】
前記出力手段は、
前記検索用文字列ベクトルと、前記類似サブテーマ表示処理により提示された少なくとも1つのサブテーマの中からユーザにより選択された少なくとも1つのサブテーマの前記サブテーマ識別情報に関連付けられて前記サブテーマ情報記憶手段に記憶された少なくとも1つの前記トピックベクトルとを用いて、それぞれのベクトルの要素の平均値若しくは加重平均値またはその他の演算値を求めて合成ベクトルを作成し、
この合成ベクトルと、前記企業文データ記憶手段に記憶された前記複数の企業文データをベクトル化した前記複数の企業文ベクトルのそれぞれとの類似度を算出することにより、前記複数の企業文データのそれぞれについての調整関連スコアを求め、
この調整関連スコアの高い順に、前記企業文データを並べ替えて表示する調整関連スコア順表示処理を実行する構成とされている
ことを特徴とする請求項7に記載のダッシュボードシステム。
【請求項10】
前記サブテーマ毎に、前記関連スコア記憶手段に記憶された各サブテーマに対する前記関連スコアを用いて、同一の前記企業識別情報に関連付けられた複数の前記関連スコアのうちの最大値の前記関連スコアを抽出し、抽出した前記関連スコアを当該企業識別情報の企業の代表関連スコアとするか、または、値が大きい上位の複数の前記関連スコアを抽出し、抽出した上位の複数の前記関連スコアを用いて算出した平均値またはその他の演算値を当該企業識別情報の企業の代表関連スコアとする処理を実行する代表関連スコア算出手段を備え、
前記出力手段は、
ユーザによる1つの着目企業の選択を受け付け、前記サブテーマ毎に、選択された前記着目企業の前記代表関連スコアと、前記着目企業以外の企業の前記代表関連スコアのうちの最も大きい前記代表関連スコアとの差分を求めるか、または、選択された前記着目企業の前記代表関連スコアと、前記着目企業以外の企業の前記代表関連スコアのうちの上位の複数の前記代表関連スコアの平均値またはその他の演算値との差分を求めることにより、前記着目企業の前記代表関連スコアについての前記着目企業以外の企業の前記代表関連スコアに対する乖離度を算出し、算出した乖離度が大きい上位の複数の前記サブテーマを取組推薦サブテーマとして抽出して画面表示する取組推薦サブテーマ抽出処理を実行し、
この取組推薦サブテーマ抽出処理で抽出した複数の前記取組推薦サブテーマの中からのユーザによる少なくとも1つの前記取組推薦サブテーマの選択を受け付け、
前記関連スコア記憶手段に記憶された前記着目企業の前記企業文データについてのユーザ選択に係る前記取組推薦サブテーマに対する前記関連スコアが高い順に、前記企業文データ記憶手段に記憶された前記着目企業の前記企業文データを画面表示する着目企業取組文表示処理と、
前記関連スコア記憶手段に記憶された前記着目企業以外の企業の前記企業文データについてのユーザ選択に係る前記取組推薦サブテーマに対する前記関連スコアが高い順に、前記企業文データ記憶手段に記憶された前記着目企業以外の企業の前記企業文データを、前記企業識別情報とともに、または、前記企業識別情報および前記関連スコアとともに画面表示する推薦取組文表示処理とを実行する構成とされている
ことを特徴とする請求項1に記載のダッシュボードシステム。
【請求項11】
前記トピック推定処理で得られた前記サブテーマに追加する拡張サブテーマを作成する拡張サブテーマ作成手段を備え、
この拡張サブテーマ作成手段は、
拡張サブテーマ用キーワードの入力を受け付ける拡張サブテーマ用キーワード入力受付処理と、
受け付けた前記拡張サブテーマ用キーワードを用いてこの拡張サブテーマ用キーワードに関連する取り組みを示す複数の取組文を作成して欲しい旨の依頼文を記載した拡張サブテーマ用取組文作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデルに入力し、この大規模言語モデルから複数の取組文データを出力させる拡張サブテーマ用取組文取得処理と、
出力された前記複数の取組文データの各々について、前記回答文データのベクトル化処理で使用した方法と同じ方法によるベクトル化処理を実行することにより、複数の取組文ベクトルを作成する取組文ベクトル作成処理と、
作成した前記複数の取組文ベクトルの平均をとって拡張サブテーマベクトルとし、得られた拡張サブテーマベクトルを、追加で付与したサブテーマ識別情報と関連付けて前記サブテーマ情報記憶手段に記憶させる拡張サブテーマベクトル作成処理とを実行する構成とされている
ことを特徴とする請求項1に記載のダッシュボードシステム。
【請求項12】
請求項1~11のいずれかに記載のダッシュボードシステムとして、コンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、健康経営を含む人的資本経営に関する情報を提示するコンピュータにより構成されたダッシュボードシステムおよびプログラムに係り、例えば、健康保険組合の事業主企業の人事部や経営企画部、経営コンサルティングファームコンサルタントの業務効率化や高度化を図る場合等に利用できる。
【背景技術】
【0002】
一般に、近代的な企業経営では、健康経営を含む人的資本経営(本願では、企業の非財務状況を含めて人的資本経営と呼ぶものとする。)に関する企業の取組が重視される。経済産業省が公開している健康経営度調査票(
図2参照)も、この一環で行われている調査である。この経済産業省による健康経営に関する調査は、毎年実施され、2022年度の健康経営度調査票データには、約2,000社分の回答データが含まれている。
【0003】
一方、健康経営を含む人的資本経営に関し、取組が不十分な企業や、取組内容をより一層充実させたい企業は、他の企業の取組内容を参照したい場合がある。また、経営コンサルティングファームが、取組が不十分な企業に対し、十分な取組を行っている優良企業の取組内容を紹介する場合もある。このような場合、他の企業の取組内容を参照したい企業や、優良企業の取組内容を紹介したい経営コンサルティングファームは、各企業が発行している統合報告書等に掲載された企業情報を参照する場合が多い。
【0004】
なお、本発明では、統合報告書データを利用してダッシュボードシステムを構築するが、この観点で関連する技術としては、統合報告書を迅速かつ客観的に評価できるとともに、評価の根拠が理解し易くなっている統合報告書評価装置が知られている(特許文献1参照)。この特許文献1の[要約]の[解決手段]には、「統合報告書評価装置1は、評価項目に対して設定された複数の概念語の各々の単語ベクトルの平均値を計算して、概念ベクトルを取得する概念ベクトル取得部12と、統合報告書の文ごとに、当該文に含まれる複数の単語の各々の単語ベクトルの平均値を計算して、文ベクトルを取得する文ベクトル取得部13と、統合報告書の文ごとに、概念ベクトルと文ベクトルとの類似度を示す特徴量を計算する特徴量計算部14と、統合報告書の文ごとに計算された特徴量に基づいて、評価項目に対するスコアを計算するスコア計算部15と、を備える。」と記載されている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
前述したように、健康経営を含む人的資本経営に関し、各企業の取組内容を知るためには、統合報告書を活用することができる。しかし、統合報告書は、各企業が自由な形式で記載した企業文書であるから、健康経営を含む人的資本経営に関する情報が整理された状態で存在するわけではない。このため、統合報告書に記載された情報について、自分(自社)が参照したい情報や、活用したい情報、すなわち健康経営を含む人的資本経営に関する必要情報が、どこに存在するのかを把握しなければならず、手間や時間がかかる。
【0007】
本発明の目的は、健康経営を含む人的資本経営に関する各企業の情報を容易に参照することができるダッシュボードシステムおよびプログラムを提供するところにある。
【課題を解決するための手段】
【0008】
本発明は、健康経営を含む人的資本経営に関する情報を提示するコンピュータにより構成されたダッシュボードシステムであって、
健康経営を含む人的資本経営に関する調査で課題として挙げられたテーマに対する各企業の回答データを含む健康経営度調査票データまたはその他の調査票データについて、各企業の回答データのそれぞれを文に分割し、分割して得られた複数の回答文データを用いて、テーマ毎に、ソフトクラスタリングまたはニューラル言語モデルにより、テーマについての複数のトピックを推定するトピック推定処理を実行することにより、回答文データの各々における各トピックの出現確率を示すトピック値を求め、複数のトピックの各々について、複数の回答文データの中から、トピック値が大きい予め定められた件数の上位の回答文データを選択抽出し、選択抽出した上位の複数件の回答文データのそれぞれをベクトル化して得られた複数の回答文ベクトルを用いて、それぞれのトピックを表現するトピックベクトルを求めるトピックベクトル算出処理を実行し、得られたトピックベクトルを、テーマの中のトピックを示すサブテーマを識別するサブテーマ識別情報と関連付けて記憶するサブテーマ情報記憶手段と、
調査票データとは異なり、各企業が企業毎の自由な記載形式で自社に関する健康経営を含む人的資本経営に関する情報を記載した各企業の統合報告書データまたはその他の企業文書データについて、各企業の企業文書データのそれぞれを文に分割し、分割して得られた複数の企業文データを、企業を識別する企業識別情報、および企業文データを識別する企業文識別情報と関連付けて記憶する企業文データ記憶手段と、
サブテーマ毎に、回答文データのベクトル化処理で使用した方法と同じ方法によるベクトル化処理により複数の企業文データのそれぞれをベクトル化して得られた複数の企業文ベクトルと、サブテーマ情報記憶手段に記憶された各サブテーマのトピックベクトルとの類似度を算出することにより、複数の企業文データのそれぞれについての各サブテーマに対する関連スコアを求める処理を実行する類似度算出手段と、
この類似度算出手段により求めた各サブテーマに対する関連スコアを、サブテーマ識別情報、企業識別情報、および企業文識別情報と関連付けて記憶する関連スコア記憶手段と、
この関連スコア記憶手段に記憶された各企業の企業文データについての各サブテーマに対する関連スコアを用いて、企業文データ記憶手段に記憶された企業文データを画面表示する処理を実行する出力手段と
を備えたことを特徴とするものである。
【0009】
ここで、「サブテーマ識別情報」は、いずれのテーマに属するいずれのトピックであるかを識別することができる1つの識別情報であってもよく、テーマ識別情報とそれぞれのテーマ内だけでトピックを識別することができるテーマ内限定のトピック識別情報との組合せであってもよい。
【0010】
また、「類似度算出手段」により関連スコアを求める処理は、ユーザがシステムを使用する前に、事前の処理として実行してもよく、ユーザがシステムを使用している最中に、リアルタイム処理で実行してもよい。前者の事前の処理とする場合は、「関連スコア記憶手段」は、不揮発性メモリにより構成され、後者のリアルタイム処理とする場合は、「関連スコア記憶手段」は、揮発性メモリでも、不揮発性メモリでもよい。
【0011】
さらに、「健康経営度調査票データまたはその他の調査票データ」とは、決められた課題のテーマに対する回答データが整理された状態で存在する調査票データであり、調査の主体は、経済産業省等の国や地方公共団体の機関に限らず、民間の調査機関であってもよく、要するに、各企業が予め定められた課題のテーマに沿って回答したデータが含まれていて、その回答データが本システムの構築のための教師データのように機能するものであればよい。従って、現在は、経済産業省により健康経営度調査票という名称が付されている調査票につき、その後に名称が変更されたとしても、同様なテーマに対する回答データを含んでいれば、名称変更後の調査票データでもよい。また、ISO30414(人的資本に関する情報開示のガイドライン)の指針の沿った調査票データでもよい。
【0012】
また、「統合報告書データまたはその他の企業文書データ」は、上記の調査票データとは異なり、各企業が企業毎の自由な記載形式で自社に関する健康経営を含む人的資本経営に関する情報を記載したものという意味であり、統合報告書の他には、例えば、有価証券報告書のうちの健康経営を含む人的資本経営に関する記載部分、サステナビリティレポート等も含まれる。従って、上記の調査票データのような整備された情報、すなわち各企業がテーマに沿って定型フォーム等で回答した情報が記載されている文書データは含まない。そもそもそのように最初から整備されている情報は、参照する者が必要情報を見つける手間や時間がかからないからである。
【0013】
このような本発明のダッシュボードシステムにおいては、「健康経営度調査票データまたはその他の調査票データ」を用いて、テーマ毎に、トピック推定処理を行って各トピックを示すサブテーマを定め、そのサブテーマを表現するトピックベクトルを求めておき、「統合報告書データまたはその他の企業文書データ」から作成した企業文データの企業文ベクトルと、トピックベクトルとの類似度を算出し、算出した類似度を、各企業文データについての各サブテーマに対する関連スコアとし、この関連スコアを用いて各企業文データを画面表示する出力処理を行う。
【0014】
従って、「健康経営度調査票データまたはその他の調査票データ」の課題のテーマがトピック推定処理で自動的に細分化されるので、テーマよりも詳細な粒度のサブテーマ(各テーマの各トピック)で課題を把握し、企業文データを参照し、あるいは比較することが可能となる。このため、本システムのユーザは、手間や時間をかけることなく、健康経営を含む人的資本経営(非財務状況を含む)に関する各企業の取組内容を参照することが可能となり、これらにより前記目的が達成される。
【0015】
<代表関連スコア算出手段を備え、出力手段が俯瞰図表示処理を実行する構成>
【0016】
また、前述した本発明のダッシュボードシステムにおいて、
サブテーマ毎に、関連スコア記憶手段に記憶された各サブテーマに対する関連スコアを用いて、同一の企業識別情報に関連付けられた複数の関連スコアのうちの最大値の関連スコアを抽出し、抽出した関連スコアを当該企業識別情報の企業の代表関連スコアとするか、または、値が大きい上位の複数の関連スコアを抽出し、抽出した上位の複数の関連スコアを用いて算出した平均値またはその他の演算値を当該企業識別情報の企業の代表関連スコアとする処理を実行する代表関連スコア算出手段を備え、
出力手段は、
縦横にセルを配置して形成された行列状の表示部の一方の軸を各サブテーマとし、他方の軸を各企業とし、各セルの表示色の濃さを、代表関連スコア算出手段により求めた代表関連スコアの大きさに対応させた俯瞰図を画面表示する俯瞰図表示処理を実行する構成とされていることが望ましい。
【0017】
ここで、「代表関連スコア算出手段」による代表関連スコアの算出処理は、ユーザがシステムを使用する前に、事前の処理として実行してもよく、ユーザがシステムを使用している最中に、リアルタイム処理で実行してもよい。
【0018】
このように代表関連スコア算出手段を備え、出力手段が俯瞰図表示処理を実行する構成とした場合には、各企業についての各サブテーマに対する取組の状況が、セルの色の濃淡により一目瞭然でわかるようになり、例えば、業界全体の取組状況や、企業間での取組状況の差異を容易に把握することが可能となる。
【0019】
<大規模言語モデルを利用するサブテーマ名取得手段を備えた構成>
【0020】
さらに、前述した本発明のダッシュボードシステムにおいて、
トピック推定処理を実行するトピック推定手段と、
このトピック推定手段によりテーマ毎にトピック推定処理を実行して得られたテーマの中の各トピックにおける各単語の出現確率を、テーマ毎に記憶するトピックモデル記憶手段と、
このトピックモデル記憶手段に記憶されたテーマ毎の各トピックにおける各単語の出現確率の中から、テーマ毎で、かつ、トピック毎に出現確率の高い予め定められた個数の上位の単語を抽出し、抽出した複数の単語およびこれらの複数の単語を用いてサブテーマ名を作成して欲しい旨の依頼文を記載したテーマ毎で、かつ、トピック毎のサブテーマ名作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデルに入力し、この大規模言語モデルから出力されたサブテーマ名を、サブテーマ識別情報と関連付けてサブテーマ情報記憶手段に記憶させるサブテーマ名取得手段とを備え、
出力手段は、
ユーザによるサブテーマ毎の情報表示要求を受け付ける際、または、サブテーマ毎の情報表示を行う際に、サブテーマ情報記憶手段に記憶されたサブテーマ名を用いる処理を実行する構成とされていることが望ましい。
【0021】
ここで、「サブテーマ名作成依頼データ」を構成する「サブテーマ名を作成して欲しい旨の依頼文」は、大規模言語モデルに「サブテーマ名」という文言を直接に入力するという意味ではなく、大規模言語モデルは、入力される文言が、サブテーマ名として使用する名称を取得するための依頼文であることを認識していないので、依頼文として入力する文言自体は、サブテーマではなく、「テーマ」またはそれに相当する「主題」等の文言でよい。
【0022】
このように大規模言語モデルを利用するサブテーマ名取得手段を備えた構成とした場合には、従来、トピック推定処理で、トピック名(本発明のサブテーマ名に相当する名称)を決める必要があるケースでは、トピック名を人が決めていたが、大規模言語モデルを利用して決めることにより、システム開発者の作業の手間が省けるとともに、客観的で、より適切な名称を採用することができる。なお、トピック推定処理を行う際のトピック数は、システム開発者が指定するものであるため、トピック推定を行う場合にいつでもトピック名が必要になるわけではないが、本発明では、企業文データを参照・検索する者が、サブテーマ(すなわち、各テーマにおける各トピック)を指定する場合や、サブテーマの単位で自社の課題を把握する場合があるので、トピック名(本発明のサブテーマ名に相当する名称)が必要になる。
【0023】
<出力手段が企業間取組比較リスト表示処理を実行する構成>
【0024】
そして、前述した本発明のダッシュボードシステムにおいて、
出力手段は、
ユーザによるサブテーマの選択、および複数の企業の選択を受け付け、選択された複数の企業の各々について、複数の企業文データの中から、選択されたサブテーマに対する関連スコアが高い上位の企業文データを選択抽出し、選択抽出した企業文データを、企業毎にまとめてリストにして対比する状態で、企業識別情報とともに、または、企業識別情報および関連スコアとともに画面表示する企業間取組比較リスト表示処理を実行する構成とされていることが望ましい。
【0025】
ここで、ユーザにより選択されて比較される「複数の企業」は、画面内に表示される文字の大きさが小さくなりすぎないようにするという観点で、2企業であることが好ましいが、3以上の企業の企業文データを、企業毎にまとめてリストにして対比する状態で表示してもよい。
【0026】
このように出力手段が企業間取組比較リスト表示処理を実行する構成とした場合には、あるサブテーマについての複数の企業の取組状況を容易に比較することが可能となる。
【0027】
<大規模言語モデルを利用する企業取組文取得手段を備えた構成>
【0028】
また、上述した出力手段が企業間取組比較リスト表示処理を実行する構成とする場合において、
出力手段による企業間取組比較リスト表示処理を実行する際に、選択抽出された企業毎の上位の複数の企業文データおよびこれらの複数の企業文データを用いて企業の取り組みを示す複数の取組文をリスト形式で作成して欲しい旨の依頼文を記載した企業取組文作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデルに入力し、この大規模言語モデルから複数の取組文をリスト形式で出力させる企業取組文取得手段を備え、
出力手段は、
企業間取組比較リスト表示処理として、企業取組文取得手段により取得した複数の取組文を、リスト形式で、企業毎の上位の複数の企業文データと対応させて画面表示する処理も実行する構成とされていることが望ましい。
【0029】
このように大規模言語モデルを利用する企業取組文取得手段を備えた構成とした場合には、企業毎の上位の複数の企業文データを用いて、大規模言語モデルにより、企業の取り組みを示す複数の取組文がリスト形式で出力され、それらが画面表示されるので、本システムのユーザは、より一層容易に、企業の取組内容を把握することが可能となるとともに、これらの取組文を、検索用文字列として利用することも可能となる。
【0030】
<出力手段が類似文検索処理を実行する構成>
【0031】
さらに、前述した本発明のダッシュボードシステムにおいて、
出力手段は、
ユーザによる任意の検索用文字列の入力を受け付け、入力された検索用文字列データを回答文データのベクトル化処理で使用した方法と同じ方法によるベクトル化処理によりベクトル化し、得られた検索用文字列ベクトルと、企業文データ記憶手段に記憶された複数の企業文データをベクトル化した複数の企業文ベクトルのそれぞれとの類似度を算出することにより、複数の企業文データのそれぞれについての検索用文字列データに対する入力文字列関連スコアを求め、求めた入力文字列関連スコアが高い順に、企業文データを並べて表示する類似文検索処理を実行する構成とされていることが望ましい。
【0032】
ここで、「検索用文字列」は、文でもよく、単語でもよく、文の場合は、1文でも、複数の文でもよい。
【0033】
このように出力手段が類似文検索処理を実行する構成とした場合には、複数の企業文データのそれぞれについて、ユーザが入力した任意の検索用文字列データに対する関連スコア(この関連スコアを、サブテーマに対する関連スコアと区別して入力文字列関連スコアと呼ぶ。)を求め、この入力文字列関連スコアを用いて企業文データを表示するので、本システムのユーザは、自分が参照したい情報を、より一層容易に表示することが可能となる。
【0034】
<出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行する構成>
【0035】
また、上述した出力手段が類似文検索処理を実行する構成とした場合において、
出力手段は、
検索用文字列ベクトルと、サブテーマ情報記憶手段に記憶された複数のサブテーマについてのトピックベクトルとの類似度を算出することにより、検索用文字列ベクトルに対する類似度が予め定められた閾値よりも大きいか若しくは閾値以上のトピックベクトルのサブテーマを抽出するか、または、類似度の大きさが予め定められた件数の上位のトピックベクトルのサブテーマを抽出し、抽出したサブテーマを画面表示してユーザに提示する類似サブテーマ表示処理を実行する構成としてもよい。
【0036】
このように出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行する構成とした場合には、本システムのユーザに対し、当該ユーザが入力した任意の検索用文字列データに類似するサブテーマを提示することができるので、そのサブテーマを利用した表示方法の変更(企業文データの表示における並び順の変更等)を行うことができる。
【0037】
<出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行した後、統合関連スコア順表示処理を実行する構成>
【0038】
さらに、上述したように、出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行する構成とした場合において、
出力手段は、
入力文字列関連スコアと、
類似サブテーマ表示処理により提示された少なくとも1つのサブテーマの中からユーザにより選択された少なくとも1つのサブテーマのサブテーマ識別情報に関連付けられて関連スコア記憶手段に記憶された関連スコアとを用いて、
複数の企業文データのそれぞれについて、入力文字列関連スコアおよび少なくとも1つの関連スコアを用いてこれらの平均値若しくは加重平均値またはその他の演算値を求め、これを統合関連スコアとし、
この統合関連スコアの高い順に、企業文データを並べ替えて表示する統合関連スコア順表示処理を実行する構成としてもよい。
【0039】
このように出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行した後、統合関連スコア順表示処理を実行する構成とした場合には、本システムのユーザは、入力文字列関連スコア(当該ユーザが入力した任意の検索用文字列データに対する関連スコア)が高い順に並べられた企業文データを、統合関連スコアの高い順に並べ替えた状態で参照することができる。つまり、類似サブテーマ表示処理で提示されたサブテーマに対する関連スコアを加味して並べ替えた状態で参照することができる。
【0040】
<出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行した後、調整関連スコア順表示処理を実行する構成>
【0041】
また、上述したように、出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行する構成とした場合において、
出力手段は、
検索用文字列ベクトルと、類似サブテーマ表示処理により提示された少なくとも1つのサブテーマの中からユーザにより選択された少なくとも1つのサブテーマのサブテーマ識別情報に関連付けられてサブテーマ情報記憶手段に記憶された少なくとも1つのトピックベクトルとを用いて、それぞれのベクトルの要素の平均値若しくは加重平均値またはその他の演算値を求めて合成ベクトルを作成し、
この合成ベクトルと、企業文データ記憶手段に記憶された複数の企業文データをベクトル化した複数の企業文ベクトルのそれぞれとの類似度を算出することにより、複数の企業文データのそれぞれについての調整関連スコアを求め、
この調整関連スコアの高い順に、企業文データを並べ替えて表示する調整関連スコア順表示処理を実行する構成としてもよい。
【0042】
このように出力手段が類似文検索処理の際に、類似サブテーマ表示処理を実行した後、調整関連スコア順表示処理を実行する構成とした場合には、本システムのユーザは、入力文字列関連スコア(当該ユーザが入力した任意の検索用文字列データに対する関連スコア)が高い順に並べられた企業文データを、調整関連スコアの高い順に並べ替えた状態で参照することができる。つまり、類似サブテーマ表示処理で提示されたサブテーマのトピックベクトルを用いて並べ替えた状態で参照することができる。
【0043】
<代表関連スコア算出手段を備えるとともに、出力手段が取組推薦サブテーマ抽出処理、着目企業取組文表示処理、推薦取組文表示処理を実行する構成>
【0044】
さらに、前述した本発明のダッシュボードシステムにおいて、
サブテーマ毎に、関連スコア記憶手段に記憶された各サブテーマに対する関連スコアを用いて、同一の企業識別情報に関連付けられた複数の関連スコアのうちの最大値の関連スコアを抽出し、抽出した関連スコアを当該企業識別情報の企業の代表関連スコアとするか、または、値が大きい上位の複数の関連スコアを抽出し、抽出した上位の複数の関連スコアを用いて算出した平均値またはその他の演算値を当該企業識別情報の企業の代表関連スコアとする処理を実行する代表関連スコア算出手段を備え、
出力手段は、
ユーザによる1つの着目企業の選択を受け付け、サブテーマ毎に、選択された着目企業の代表関連スコアと、着目企業以外の企業の代表関連スコアのうちの最も大きい代表関連スコアとの差分を求めるか、または、選択された着目企業の代表関連スコアと、着目企業以外の企業の代表関連スコアのうちの上位の複数の代表関連スコアの平均値またはその他の演算値との差分を求めることにより、着目企業の代表関連スコアについての着目企業以外の企業の代表関連スコアに対する乖離度を算出し、算出した乖離度が大きい上位の複数のサブテーマを取組推薦サブテーマとして抽出して画面表示する取組推薦サブテーマ抽出処理を実行し、
この取組推薦サブテーマ抽出処理で抽出した複数の取組推薦サブテーマの中からのユーザによる少なくとも1つの取組推薦サブテーマの選択を受け付け、
関連スコア記憶手段に記憶された着目企業の企業文データについてのユーザ選択に係る取組推薦サブテーマに対する関連スコアが高い順に、企業文データ記憶手段に記憶された着目企業の企業文データを画面表示する着目企業取組文表示処理と、
関連スコア記憶手段に記憶された着目企業以外の企業の企業文データについてのユーザ選択に係る取組推薦サブテーマに対する関連スコアが高い順に、企業文データ記憶手段に記憶された着目企業以外の企業の企業文データを、企業識別情報とともに、または、企業識別情報および関連スコアとともに画面表示する推薦取組文表示処理とを実行する構成としてもよい。
【0045】
このように代表関連スコア算出手段を備えるとともに、出力手段が取組推薦サブテーマ抽出処理、着目企業取組文表示処理、推薦取組文表示処理を実行する構成とした場合には、健康経営を含む人的資本経営に関し、取組の改善が必要な着目企業に対する推薦取組文を画面表示することが可能となる。このため、健康経営を含む人的資本経営に関する取組が不十分な企業や、取組内容をより一層充実させたい企業が、本システムのユーザとなっている場合には、参考にすべき他の企業の取組内容を容易に参照することができ、効率的な情報収集を行うことができる。また、経営コンサルティングファームが、本システムのユーザとなっている場合には、取組が不十分な企業に対し、十分な取組を行っている優良企業の取組内容を紹介する作業を、効率的に行うことができる。
【0046】
<拡張サブテーマ作成手段を備えた構成>
【0047】
また、前述した本発明のダッシュボードシステムにおいて、
トピック推定処理で得られたサブテーマに追加する拡張サブテーマを作成する拡張サブテーマ作成手段を備え、
この拡張サブテーマ作成手段は、
拡張サブテーマ用キーワードの入力を受け付ける拡張サブテーマ用キーワード入力受付処理と、
受け付けた拡張サブテーマ用キーワードを用いてこの拡張サブテーマ用キーワードに関連する取り組みを示す複数の取組文を作成して欲しい旨の依頼文を記載した拡張サブテーマ用取組文作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデルに入力し、この大規模言語モデルから複数の取組文データを出力させる拡張サブテーマ用取組文取得処理と、
出力された複数の取組文データの各々について、回答文データのベクトル化処理で使用した方法と同じ方法によるベクトル化処理を実行することにより、複数の取組文ベクトルを作成する取組文ベクトル作成処理と、
作成した複数の取組文ベクトルの平均をとって拡張サブテーマベクトルとし、得られた拡張サブテーマベクトルを、追加で付与したサブテーマ識別情報と関連付けてサブテーマ情報記憶手段に記憶させる拡張サブテーマベクトル作成処理とを実行する構成とされていることが望ましい。
【0048】
このように拡張サブテーマ作成手段を備えた構成とした場合には、任意のサブテーマを構築し、拡張サブテーマとすることができる。すなわち、課題のテーマを細分化して得られたサブテーマ(各テーマの中の各トピック)とは別に、少なくとも1つの任意の拡張サブテーマを用意し、ユーザに提供することが可能となる。このため、ユーザのニーズに沿ったシステムを構築することができ、システムの利便性を向上させることができる。
【0049】
<プログラムの発明>
【0050】
そして、本発明のプログラムは、以上に述べたダッシュボードシステムとして、コンピュータを機能させるためのものである。
【0051】
なお、上記のプログラムまたはその一部は、例えば、光磁気ディスク(MO)、コンパクトディスク(CD)、デジタル・バーサタイル・ディスク(DVD)、フレキシブルディスク(FD)、磁気テープ、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)、フラッシュディスク等の記録媒体に記録して保存や流通等させることが可能であるとともに、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等の有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に載せて搬送することも可能である。さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。
【発明の効果】
【0052】
以上に述べたように本発明によれば、健康経営度調査票データまたはその他の調査票データを用いて、テーマ毎に、トピック推定処理を行って各トピックを示すサブテーマを定め、そのサブテーマを表現するトピックベクトルを求めておき、統合報告書データまたはその他の企業文書データから作成した企業文データの企業文ベクトルと、トピックベクトルとの類似度を算出し、算出した類似度を、各企業文データについての各サブテーマに対する関連スコアとし、この関連スコアを用いて各企業文データを画面表示するので、本システムのユーザは、手間や時間をかけることなく、健康経営を含む人的資本経営に関する各企業の取組内容を参照することができるという効果がある。
【図面の簡単な説明】
【0053】
【
図1】本発明の一実施形態のダッシュボードシステムの全体構成図。
【
図2】前記実施形態の回答データを含む健康経営度調査票データの例示図。
【
図3】前記実施形態のトピック推定処理およびその準備処理の説明図。
【
図4】前記実施形態のトピックベクトルの算出処理の説明図。
【
図5】前記実施形態の関連スコアおよび代表関連スコアの算出処理の説明図。
【
図8】前記実施形態の企業間取組比較リスト表示画面の例示図。
【
図9】前記実施形態の各社取組文表示画面の例示図。
【
図11】前記実施形態の類似するサブテーマによる関連スコアの統合または調整の説明図。
【
図13】前記実施形態のサブテーマ名の取得処理の説明図。
【
図14】前記実施形態の企業取組文の取得処理の説明図。
【
図15】前記実施形態のダッシュボードシステムによる処理の流れを示すフローチャートの図。
【発明を実施するための形態】
【0054】
以下に本発明の一実施形態について図面を参照して説明する。
図1には、本実施形態のダッシュボードシステム10の全体構成が示され、
図2には、回答データを含む健康経営度調査票データの例が示されている。
図3は、トピック推定手段34によるトピック推定処理およびトピック推定準備手段33による準備処理の説明図であり、
図4は、トピックベクトル算出手段36によるトピックベクトルの算出処理の説明図であり、
図5は、類似度算出手段39による関連スコアの算出処理および代表関連スコア算出手段40による代表関連スコアの算出処理の説明図である。また、
図6には、出力手段41による画面遷移の一例が示され、
図7には、俯瞰図表示画面の一例が示され、
図8には、企業間取組比較リスト表示画面の一例が示され、
図9には、各社取組文表示画面の一例が示され、
図10には、類似文検索画面の一例が示され、
図11は、類似するサブテーマによる関連スコアの統合または調整の説明図であり、
図12には、推薦画面の一例が示されている。さらに、
図13は、サブテーマ名取得手段35によるサブテーマ名の取得処理の説明図であり、
図14は、企業取組文取得手段42による企業取組文の取得処理の説明図であり、
図15には、ダッシュボードシステム10による処理の流れがフローチャートで示されている。
【0055】
<ダッシュボードシステム10の全体構成>
【0056】
図1において、ダッシュボードシステム10は、1台または複数台のコンピュータにより構成された本体20と、液晶ディスプレイ等の表示手段80と、マウスやキーボード等の入力手段81とを備えている。また、本体20には、ネットワーク1を介して大規模言語モデル(LLM:Large Language Models)によるサービス提供システム70が接続されている。
【0057】
ここで、大規模言語モデル(LLM)によるサービス提供システム70は、クラウドAPI(Application Programming Interface)のサービスを提供するシステムであり、本実施形態では、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT:Chat Generative Pre-trained Transformer、Azure OpenAI ChatCompletion API GPT-4)を使用するが、これに限定されず、例えば、OpenAI社のGPT-3.5、グーグル社(Google)のPalm、Palm2、アマゾンウェブサービス(AWS)のTitan、メタ・プラットフォームズ社(Meta)のLlama等を採用してもよい。
【0058】
また、ネットワーク1は、主としてインターネットにより構成された外部ネットワークであり、インターネットと、LANやイントラネット等の内部ネットワークとの組合せでもよく、有線であるか無線であるか、さらには有線および無線の混在型であるかは問わず、要するに、複数地点(距離の長短は問わない。)間で、ある程度の速度をもって情報を伝送することができるものであればよい。
【0059】
なお、図示は省略されているが、ネットワーク1で接続されたクラウドAPIによる外部のサービス提供システムとしては、大規模言語モデル(LLM)によるサービス提供システム70の他に、例えば、テキストデータのベクトル化処理を行うサービス提供システムや、PDFデータ等をテキストデータにするOCR処理を行うサービス提供システム等がある。
【0060】
本体20は、健康経営を含む人的資本経営に関する情報を提示するための各種の処理を実行する処理手段30と、この処理手段30による処理に必要な各種のデータを記憶する記憶手段50とを備えている。
【0061】
処理手段30は、回答文データ作成手段31と、回答文ベクトル作成手段32と、トピック推定準備手段33と、トピック推定手段34と、サブテーマ名取得手段35と、トピックベクトル算出手段36と、企業文データ作成手段37と、企業文ベクトル作成手段38と、類似度算出手段39と、代表関連スコア算出手段40と、出力手段41と、企業取組文取得手段42とを含んで構成されている。
【0062】
ここで、処理手段30に含まれる各手段31~42は、本体20の内部に設けられた中央演算処理装置(CPU)、およびこのCPUの動作手順を規定する1つまたは複数のプログラム、並びに主メモリやキャッシュメモリ等の作業用メモリにより実現される。これらの各手段31~42の詳細は後述する。
【0063】
記憶手段50は、調査票データ記憶手段51と、回答文データ記憶手段52と、回答文ベクトル記憶手段53と、トピックモデル記憶手段54と、サブテーマ情報記憶手段55と、企業文書データ記憶手段56と、企業文データ記憶手段57と、企業文ベクトル記憶手段58と、関連スコア記憶手段59と、代表関連スコア記憶手段60とを含んで構成されている。
【0064】
ここで、記憶手段50に含まれる各記憶手段51~60としては、例えば、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)等の不揮発性メモリを採用することができる。データの保存形式は、データベースとすることが好適であるが、調査票データ記憶手段51や企業文書データ記憶手段56は、ファイルとしてもよい。但し、関連スコア記憶手段59や代表関連スコア記憶手段60は、関連スコアや代表関連スコアを、事前の処理で算出しておくのではなく、本システムのユーザの操作に伴ってリアルタイム処理で算出する場合には、主メモリ(揮発性メモリ)としてもよい。これらの記憶手段51~60の詳細は後述する。
【0065】
<回答文データ作成手段31の構成>
【0066】
回答文データ作成手段31は、調査票データ記憶手段51に記憶された各企業の健康経営度調査票データまたはその他の調査票データに含まれている各テーマ(課題のテーマ)の回答データ(
図2参照)を、句点ごとの文に分割することにより、各企業の回答文データを作成し、テーマ識別情報、企業識別情報(銘柄コードや銘柄名等)、および回答文識別情報と関連付けて回答文データ記憶手段52(
図3参照)に記憶させる処理を実行するものである。
【0067】
この際、調査票データがテキストデータではなく、PDFデータ等である場合は、データ変換の処理や、OCR処理等を行い、テキストデータにしてから分割する。なお、トピック推定処理において、いずれの企業の回答文データであるかは区別しないので、回答文識別情報は、企業内での識別情報ではなく、テーマ内での識別情報(通番)としている。
【0068】
図2に示すように、健康経営度調査票データには、(a)課題のテーマ、(b)課題の内容、(c)施策実施結果、(d)効果検証結果が記入されており、このうち、本発明における回答データとして使用するものは、(b)、(c)、(d)の記入データである。従って、回答文データ作成手段31は、(b)の回答データを、回答文データb1,b2,b3,…に分割し、(c)の回答データを、回答文データc1,c2,c3,…に分割し、(d)の回答データを、回答文データd1,d2,d3,…に分割する。
【0069】
なお、企業によっては、(b)、(c)、(d)の区分けを誤解して回答している場合もあるが、多くの企業の回答データを収集して回答文データを作成していることと、(b)、(c)、(d)の回答データから作成した回答文データを区別せずにトピック推定処理に用いていることから、問題にはならない。また、トピック推定を適切なものとするためには、(b)、(c)、(d)の3つ全部の回答データを用いることが好ましいが、必ずしも、(b)、(c)、(d)の3つ全部を用いなくても、トピック推定処理を行うことができる。この意味で、将来的に、調査票の(b)、(c)、(d)の区分けが変わり、区分の数に増減があった場合には、全部の区分の回答データを用いることが好ましいが、用いない区分のデータがあってもよい。
【0070】
さらに、健康経営度調査票データ等の調査票データは、基本的には、毎年作成されるが、その都度、トピック推定処理を実行してもよく、前年以前に実行したトピック推定処理で得られたトピックベクトルを使用し続けてもよい。また、トピック推定処理を再度実行する場合は、テーマの内容が一致する限りにおいては、過去の回答データと、最新の回答データとを混在させて用いてもよく、最新の回答データだけを用いてもよい。なお、年度が変わり、テーマが一致しなくなった場合(例えば、テーマの数が、10から9に、あるいは10から11に変わった場合等)には、原則的には、過去の回答データと、最新の回答データとを混在させて用いないほうがよい。トピック推定処理は、テーマ毎に実行するものであり、テーマの数が変われば(つまり、各テーマの内容が変われば)、各テーマにおける各企業の回答内容が異なってくるからである。
【0071】
<回答文ベクトル作成手段32の構成>
【0072】
回答文ベクトル作成手段32は、回答文データ記憶手段52(
図3参照)に記憶さている回答文データをベクトル化し、得られた回答文ベクトルを、テーマ識別情報、企業識別情報(銘柄コードや銘柄名等)、および回答文識別情報と関連付けて回答文ベクトル記憶手段53(
図4参照)に記憶させる処理を実行するものである。
【0073】
この回答文ベクトル作成手段32は、本実施形態では、一例として、アズール・オープンAI・エンベッディングス・APIのサービス提供システム(Azure OpenAI Embeddings API text-embedding-ada-002 version2)を使用し、
図4に示すように、回答文データをベクトル化し、1,536次元の回答文ベクトルを得る。なお、エンベッディングの手法は、Doc2Vec、BERT、Transformer等でもよい。回答文ベクトルの次元数も、1,536次元に限定されるものではない。
【0074】
<トピック推定準備手段33の構成>
【0075】
トピック推定準備手段33は、
図3に示すように、回答文データ記憶手段52に記憶さている各企業のそれぞれの回答文データについて、不要な記号やタグ等(例えば、☆、(1)(環境依存の「まるいち」)、<br>等)を除去する処理、形態素解析で単語に分解(分割)し、名詞のみを抽出する処理、不要な単語を除去する処理を実行する。なお、これらの準備処理は、本願出願人による特開2021-26413や特開2022-190557に記載された処理と同様である。
【0076】
この際、トピック推定準備手段33は、既存の解析ツールを利用して形態素解析を実行することができる。
【0077】
また、トピック推定準備手段33は、不要な単語の除去処理では、単語の絞り込みを行う。すなわち、先ず、単語の品詞や出現回数に基づいて、単語をフィルタリングする。全ての回答文データの集合において、出現回数が、例えば3回未満の単語は捨てる。全ての回答文データの集合における各単語と出現回数との関係は、図示されない単語出現回数記憶手段に記憶されている。次に、トピック推定準備手段33は、図示されない不要語辞書記憶手段に記憶されている不要語(ノイズ単語)を排除する。具体的には、例えば、「企業」や「当社」等のようなテーマに関係なく出現すると考えられる単語は、不要語として排除する。
【0078】
図3の例では、トピック推定準備手段33による以上の不要な記号やタグ等の除去処理、形態素解析による単語への分解および名詞のみの抽出処理、不要な単語の除去処理を経た後に残る単語は、「眠気」、「就業中」、…となる。従って、
図3に示すように、残った各単語とそれらの出現回数との関係が得られ、この関係が、トピック推定を行うために必要な情報となる。すなわち、トピック推定処理において1つの文書データ(ここでいう文書データは、本発明における企業文書データのことではなく、トピック推定処理を実行(説明)する際に一般的に呼称される文書データのことである。)として取り扱われる1つの回答文データ(i=00001234)における各単語の出現回数となる。i=00001234は、回答文識別情報(例えば、X社の回答文b1の識別番号)である。そして、全ての回答文データ(i=1~n:nは回答文データの数)について、各単語の出現回数が得られる。さらに、
図3の例は、テーマ4についての処理であるが、以上の処理を、テーマ毎に、全てのテーマについて行う。なお、トピック推定処理は、テーマ毎に実行するので、本実施形態では、回答文識別情報は、それぞれのテーマ限りで回答文を識別することが可能なテーマ内での識別情報(テーマ内での通番)としている。但し、回答文識別情報は、全テーマを横断した識別情報としてもよい。
【0079】
<トピック推定手段34の構成>
【0080】
トピック推定手段34は、テーマ毎に、回答文データ記憶手段52(
図3参照)に記憶さている各企業の回答文データを用いて、ソフトクラスタリングまたはニューラル言語モデルにより、それぞれのテーマについての複数のトピックを推定するトピック推定処理を実行するものである。1つのテーマについて複数のトピックを推定する処理を、全てのテーマについて実行するという意味である。
【0081】
より具体的には、トピック推定処理を実行する際のソフトクラスタリングまたはニューラル言語モデルについては、本実施形態では、一例として、レイテント・ディリクレ・アロケーション(LDA:Latent Dirichlet Allocation、潜在的ディリクレ配分法)を採用する。すなわち、トピック推定手段34は、本実施形態では、
図3に示すように、テーマ毎に、トピック推定準備手段33による処理で得られたそれぞれの回答文データ(i=1~n:nはテーマ内の回答文データの数)における各単語の出現回数を用いて、レイテント・ディリクレ・アロケーション(LDA)により、回答文データ(i)における各トピックの出現確率を示すトピック値(縦ベクトルπ(i))、および、各トピックにおける各単語の出現確率(行列β)を求めるトピック推定処理を実行し、このトピック推定処理で得られた縦ベクトルπ(i)で示されるトピック分布および行列βを、テーマ毎に、トピックモデルとしてトピックモデル記憶手段54に記憶させる処理を実行する。行列βは、
図3に示すように、K行p列(Kはトピック数、pは単語数)の行列である。テーマにおけるトピック数Kは、システム開発者が指定するが、各テーマで同じ数とする必要はなく、具体的には、例えば、テーマ1~10のトピック数Kは、テーマ1から順に、5,5,7,5,5,6,5,6,4,4としている。
【0082】
また、レイテント・ディリクレ・アロケーション(LDA)の他には、例えば、ファジー・Cミーンズ(Fuzzy c-means)、混合分布モデル、非負値行列因子分解(NMF:Non-negative Matrix Factorization)、pLSI(probabilistic Latent Semantic Indexing)、Doc2Vec、SCDV(Sparse Compose Document Vecotors)等を採用することができる。例えば、Doc2Vecを実装する場合には、既存のGensimと呼ばれるライブラリを用いることができる。
【0083】
<サブテーマ名取得手段35の構成>
【0084】
サブテーマ名取得手段35は、トピックモデル記憶手段54に記憶されたテーマ毎の各トピックにおける各単語の出現確率(行列β)の中から、テーマ毎で、かつ、トピック毎に出現確率の高い予め定められた個数の上位(例えば上位10個)の単語を抽出し、すなわち、行列βの各行おいて出現確率が高い例えば上位10個の単語を抽出し、抽出した複数(例えば10個)の単語およびこれらの複数の単語を用いてサブテーマ名を作成して欲しい旨の依頼文を記載したテーマ毎で、かつ、トピック毎のサブテーマ名作成依頼データを作成し、作成したサブテーマ名作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデル(LLM)に入力し、この大規模言語モデル(LLM)から出力されたサブテーマ名を、サブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶させる処理を実行するものである。
【0085】
具体的には、サブテーマ名取得手段35は、
図13に示すように、例えば、「下記単語に共通するテーマを10文字くらいで一つ考えて」というテキストデータに、「0 労働時間…9 報告」という10個の単語を加えたサブテーマ名作成依頼データを作成し、作成したサブテーマ名作成依頼データを、ネットワーク1を介して大規模言語モデル(LLM)によるサービス提供システム70に送信し、大規模言語モデルから返ってくるデータを受信し、受信したデータを、テーマの中のトピックを示す名称、すなわちサブテーマ名として、サブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶させる。
図13の例では、「労働時間改善の実施状況報告」が大規模言語モデルによるサービス提供システム70から返ってくるので、これがサブテーマ名となる。なお、大規模言語モデル(LLM)への依頼文に、「サブテーマを…考えて」ではなく、「テーマを…考えて」と入力しているのは、大規模言語モデルは、自分の返信データが、サブテーマ名として使用されることを認識していないからである。
【0086】
<トピックベクトル算出手段36の構成>
【0087】
トピックベクトル算出手段36は、テーマ毎に、テーマの中の複数のトピックの各々について、複数の回答文データの中から、トピック値が大きい予め定められた件数(U件)の上位(例えば、上位10件)の回答文データを選択抽出し、選択抽出した上位の複数件(例えば、U=10件)の回答文データのそれぞれをベクトル化して得られた複数の回答文ベクトル(本実施形態では、回答文ベクトル作成手段32により作成されて回答文ベクトル記憶手段53(
図4参照)に記憶されている1,536次元の回答文ベクトル)を用いて、それぞれのトピックを表現するトピックベクトル(本実施形態では、1,536次元のベクトルとなる。)を求め、求めたトピックベクトルを、サブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶させるトピックベクトル算出処理を実行するものである。
【0088】
この際、トピックベクトル算出手段36は、
図4に示すように、選択抽出した上位の複数件(例えば、U=10件)の回答文データの回答文ベクトルについての平均ベクトルを求め、それをトピックベクトルとする。但し、ベクトルの各次元の要素の値を単純平均した平均ベクトルに限らず、例えば、加重平均ベクトル、調和平均ベクトル等としてもよく、要するに、上位の複数件(例えば、U=10件)の回答文ベクトルを用いて、何らかの演算を行い、トピックベクトルを算出すればよい。加重平均ベクトルを算出してトピックベクトルとする場合でも、何を重みにするかは任意であり、例えば、トピック値が1番大きい回答文データの回答文ベクトルの影響を大きくするなら、トピック値が1番大きい回答文データの回答文ベクトルの重みを10とし、トピック値が2番目に大きい回答文データの回答文ベクトルの重みを9とし、トピック値が3番目に大きい回答文データの回答文ベクトルの重みを8とし、…、トピック値が10番目に大きい回答文データの回答文ベクトルの重みを1とし、それらを合計して(10+9+8+…+1)=55で割ればよく、また、回答文データの長さ(文字数)を重みとして加重平均を算出してもよい。
【0089】
より具体的には、トピックベクトル算出手段36は、
図4に示すように、例えばテーマ4の中の複数のトピック(トピック番号=1~K:Kはトピック数であり、例えばK=5)のうち、先ず、トピック番号=1のトピックに着目する。すなわち、トピックモデル記憶手段54に記憶されているトピック分布を示す縦ベクトルπ(i)のうち、1番上の要素(第1次元の要素)のトピック値π(i,1)に着目し、この値が大きい上位の複数件(例えば、U=10件)の回答文データの回答文識別情報を抽出する。
図4の例では、i=00000264、i=00000967、i=00001764、…が抽出される。そして、回答文ベクトル記憶手段53から、i=00000264、i=00000967、i=00001764、…のU個(例えばU=10)の回答文ベクトル(1,536次元のベクトル)を取得し、これらのU個の回答文ベクトルの平均ベクトルを求め、これをテーマ4の中のトピック番号=1のトピックについてのトピックベクトルとし、サブテーマ識別情報=「4-1」と関連付けてサブテーマ情報記憶手段55に記憶させる。
【0090】
次に、トピックベクトル算出手段36は、トピック番号=2のトピックに着目する。すなわち、トピックモデル記憶手段54に記憶されているトピック分布を示す縦ベクトルπ(i)のうち、上から2番目の要素(第2次元の要素)のトピック値π(i,2)に着目し、この値が大きい上位の複数件(例えば、U=10件)の回答文データの回答文識別情報を抽出する。
図4の例では、i=00000134、i=00000777、i=00001348、…が抽出される。そして、回答文ベクトル記憶手段53から、i=00000134、i=00000777、i=00001348、…のU個(例えばU=10)の回答文ベクトル(1,536次元のベクトル)を取得し、それらのU個の回答文ベクトルの平均ベクトルを求め、これをテーマ4の中のトピック番号=2のトピックについてのトピックベクトルとし、サブテーマ識別情報=「4-2」と関連付けてサブテーマ情報記憶手段55に記憶させる。
【0091】
そして、トピックベクトル算出手段36は、テーマ4のトピック数K=5の場合には、以上の処理を、トピック番号=3,4,5についても実行する。さらに、このような処理を、テーマ4だけではなく、他のテーマ1~3,5~10についても実行する。
【0092】
<企業文データ作成手段37の構成>
【0093】
企業文データ作成手段37は、
図5に示すように、企業文書データ記憶手段56に記憶されている各企業の統合報告書データまたはその他の企業文書データ(調査票データとは異なり、各企業が企業毎の自由な記載形式で自社に関する健康経営を含む人的資本経営に関する情報を記載したもの)のそれぞれを句点ごとの文に分割し、分割して得られた複数の企業文データを、企業識別情報(銘柄コードや銘柄名等)、および企業文データを識別する企業文識別情報と関連付けて企業文データ記憶手段57に記憶させる処理を実行するものである。
【0094】
この際、企業文データ作成手段37は、統合報告書データ等の企業文書データが、PDFデータである場合には、企業文書データを企業文データに分割する前に、企業によってフォーマットが様々な状態である統合報告書データ等の企業文書データをテキスト化しなければならない。しかし、PDFデータからテキストデータへの一般的な変換方法では、文字化けが生じたり、同一ページ内の異なるブロックに記載されている文字列が、ブロックを跨いで不自然な状態で繋がってしまうという不都合(本来、繋がるべきではない異なるブロック(左右に並んでいるブロック)中の各文字列が、同一ページ内の同じ行の位置に配置されていることが原因で、繋がってしまうという不都合等)が生じる。そこで、企業文データ作成手段37は、PDFデータである統合報告書データ等の企業文書データに対し、OCR技術を適用することにより、文字化けの発生問題を大幅に解消し、ブロックごとに文字列を抽出する。
【0095】
ここで、OCR技術としては、例えば、アズール・フォーム・レコグナイザ(Azure Form Recognizer)を採用することが好適である。これはクラウドAPIによるサービス提供システムである。その他には、英語のテキスト化であれば、アマゾンウェブサービス(AWS)のTextractや、グーグル社(Google)のオープンソースソフトウェア(OSS)であるpaddleOCR等を採用してもよい。
【0096】
<企業文ベクトル作成手段38の構成>
【0097】
企業文ベクトル作成手段38は、
図5に示すように、企業文データ記憶手段57に記憶されている複数の企業文データを、それぞれベクトル化して企業文ベクトルを作成し、作成した複数の企業文ベクトルを、企業識別情報(銘柄コードや銘柄名等)および企業文識別情報と関連付けて企業文ベクトル記憶手段58に記憶させる処理を実行するものである。企業文ベクトルに対応する企業文識別情報は、作成元の企業文データに対応する企業文識別情報と同じである。
【0098】
この際、企業文ベクトル作成手段38は、回答文ベクトル作成手段32による回答文データのベクトル化処理で使用した方法と同じ方法(本実施形態では、例えば、Azure OpenAI Embeddings API text-embedding-ada-002 version2)によるベクトル化処理により、複数の企業文データのそれぞれをベクトル化する。従って、回答文ベクトルが、1,536次元のベクトルであれば、企業文ベクトルも、1,536次元のベクトルとなる。また、トピックベクトルは、
図4に示すように、U個(例えば、U=10)の回答文ベクトルを用いて作成されるので、次元数は回答文ベクトルと同じであり、1,536次元のベクトルとなる。このため、企業文ベクトルと、トピックベクトルとは、同じ次元数であり、
図5に示すように、コサイン類似度等の類似度を算出することができる。
【0099】
<類似度算出手段39の構成>
【0100】
類似度算出手段39は、
図5に示すように、サブテーマ毎に、企業文ベクトル記憶手段58に記憶されている複数の企業文ベクトルと、サブテーマ情報記憶手段55に記憶されている各サブテーマのトピックベクトルとの類似度(本実施形態では、コサイン類似度)を算出することにより、複数の企業文データのそれぞれについての各サブテーマに対する関連スコアを求め、求めた関連スコアを、サブテーマ識別情報、企業識別情報(銘柄コードや銘柄名等)、および企業文識別情報と関連付けて関連スコア記憶手段59に記憶させる処理を実行するものである。
【0101】
従って、任意の1つの企業文データは、複数のサブテーマの各々(各テーマの各トピック)に対する関連スコアを持っている。なお、この関連スコアは、事前に算出して不揮発メモリに記憶させておいてもよく、ユーザによる企業文データの参照・検索時に算出してよく、後者の場合は、関連スコア記憶手段59は主メモリでよい。
【0102】
<代表関連スコア算出手段40の構成>
【0103】
代表関連スコア算出手段40は、
図5に示すように、サブテーマ毎に、関連スコア記憶手段59に記憶された各サブテーマに対する関連スコアを用いて、同一の企業識別情報に関連付けられた複数の関連スコアのうちの最大値の関連スコアを抽出し、抽出した関連スコアを当該企業識別情報の企業の代表関連スコアとするか、または、値が大きい上位の複数(V個、例えば、V=5)の関連スコアを抽出し、抽出した上位の複数(V個)の関連スコアを用いて算出した平均値若しくは加重平均値またはその他の演算値を当該企業識別情報の企業の代表関連スコアとし、サブテーマ識別情報および企業識別情報(銘柄コードや銘柄名等)と関連付けて代表関連スコア記憶手段60に記憶させる処理を実行するものである。
【0104】
従って、任意の1つの企業には、複数の企業文データがあるので、それぞれの企業文データについての各サブテーマに対する関連スコアがある。すなわち、任意の1つの企業には、企業文データの数に、サブテーマの数を乗じた数だけ関連スコアがある。これに対し、任意の1つの企業には、各サブテーマに対する代表関連スコアが1つずつある。すなわち、任意の1つの企業には、サブテーマの数だけ代表関連スコアがある。このため、代表関連スコアは、出力手段41による俯瞰図表示処理および取組推薦サブテーマ抽出処理に使用される。
【0105】
<出力手段41の構成>
【0106】
出力手段41は、関連スコア記憶手段59に記憶された各企業の企業文データについての各サブテーマに対する関連スコアを用いて、企業文データを画面表示する処理を含む各種の出力処理を実行するものである。
【0107】
より具体的には、出力手段41は、俯瞰図表示処理(
図7参照)、企業間取組比較リスト表示処理(
図8参照)、各社取組文表示処理(
図9参照)、類似文検索処理(
図10参照)、類似サブテーマ表示処理(
図10参照)、統合関連スコア順表示処理(
図10、
図11参照)、調整関連スコア順表示処理(
図10、
図11参照)、推薦画面表示処理(
図12参照)、取組推薦サブテーマ抽出処理(
図12参照)、着目企業取組文表示処理(
図12参照)、推薦取組文表示処理(
図12参照)を実行し、その他に、ファクトイド型質問画面300やキーワード検索画面310の表示処理(
図6参照)を実行する。
【0108】
ユーザは、
図6に示された各画面100,130,160,200,230,300,310のうちのいずれの画面からでも参照・検索作業を開始することができるようになっている。そして、
図6中の点線の矢印で示すように、いずれの画面からでも他の画面に移動することができる。また、
図6中の実線の矢印で示すように、前の画面から次の画面へと遷移用情報を渡して画面遷移することもできる。
【0109】
【0110】
図7において、出力手段41により表示される俯瞰図表示画面100には、縦横に行列状に配置された複数のセルにより各企業の各サブテーマに対する取組状況を示す表示部101が設けられている。この表示部101の縦軸には、各企業の企業識別情報(銘柄名や銘柄コード等)の表示部102およびこの表示部102に表示された企業を選択する企業選択部103が設けられ、横軸には、各サブテーマのサブテーマ名の表示部104およびこの表示部104に表示されたサブテーマを選択するサブテーマ選択部105が設けられている。
【0111】
表示部101を構成する各セルは、色付けされていて、その色の濃淡が、代表関連スコア記憶手段60に記憶されている代表関連スコアの値の大きさ、すなわち各企業の各サブテーマに対する取組状況(取組の度合い)を示すようになっている。色の濃淡と、代表関連スコアの値の大きさとの関係は、濃淡・スコア関係表示部106に示されている。色が濃い程、代表関連スコアの値が大きく、取組状況が良好であることを示している。従って、
図7の表示部101の例において、右側のテーマ10(
図2のテーマ10と同じである。)に属する各サブテーマについての色の濃淡を見ると、全体的に淡いことがわかるので、各社のテーマ10の各サブテーマへの取組が不十分であることがわかる。しかし、その中でも、Y社については、他社と比較して色が濃いので、十分な取組が行われていることがわかる。
【0112】
表示部104に表示されるサブテーマ名は、サブテーマ識別情報に関連付けられてサブテーマ情報記憶手段55に記憶されている名称である。
【0113】
また、
図7の例では、Y社についてハイライト表示107が行われている。このハイライト表示107は、類似文検索画面200(
図6、
図10参照)の企業選択部205でユーザにより指定された企業を示している。
【0114】
なお、
図7の例では、図面のスペース上の制約から、全ての企業と、全てのサブテーマとの関係が示されていないが、実際の俯瞰図は、点線で省略している部分のセルも埋められている状態である。
【0115】
さらに、
図7の俯瞰図表示画面100には、企業間取組比較リスト表示画面130(
図8参照)に移動するための「企業間取組比較リスト表示」ボタン110と、各社取組文表示画面160(
図9参照)に移動するための「各社取組文表示」ボタン111と、類似文検索画面200(
図10参照)に移動するための「類似文検索」ボタン112と、推薦画面230(
図12参照)に移動するための「推薦」ボタン113と、ファクトイド型質問画面300(
図6参照)に移動するための「ファクトイド型質問」ボタン114と、キーワード検索画面310(
図6参照)に移動するための「キーワード検索」ボタン115とが設けられている。
【0116】
図7の俯瞰図表示画面100において、ユーザが、企業選択部103で2つの企業を選択し、かつ、サブテーマ選択部105で1つのサブテーマを選択した状態で、「企業間取組比較リスト表示」ボタン110を押し下げると、選択された2つの企業の企業識別情報および1つのサブテーマのサブテーマ識別情報が、企業間取組比較リスト表示処理(
図8参照)に使用される(
図6参照)。なお、何も選択せずに「企業間取組比較リスト表示」ボタン110を押し下げても、企業間取組比較リスト表示画面130(
図8参照)に移動することができるが、ユーザは、その画面130で、所望の表示のための選択操作を行うことになる。
【0117】
また、
図7の俯瞰図表示画面100において、ユーザが、サブテーマ選択部105で1つのサブテーマを選択した状態で、「各社取組文表示」ボタン111を押し下げると、選択された1つのサブテーマのサブテーマ識別情報が、各社取組文表示処理(
図9参照)に使用される(
図6参照)。なお、何も選択せずに「各社取組文表示」ボタン111を押し下げても、各社取組文表示画面160(
図9参照)に移動することができるが、ユーザは、その画面160で、所望の表示のための選択操作を行うことになる。
【0118】
さらに、
図7の俯瞰図表示画面100において、ユーザが、企業選択部103で1つの企業を選択した状態で、「推薦」ボタン113を押し下げると、選択された1つの企業(着目企業である要取組改善企業)の企業識別情報が、推薦画面表示処理(
図12参照)に使用される(
図6参照)。なお、何も選択せずに「推薦」ボタン113を押し下げても、推薦画面230(
図12参照)に移動することができるが、ユーザは、その画面230で、所望の表示のための選択操作を行うことになる。
【0119】
また、図示は省略されているが、企業識別情報(銘柄コードや銘柄名等)と業界識別情報との関連付けを記憶する帰属業界記憶手段があるので、ユーザが情報を参照・検索したい業界を指定できるようにしておくことで、所望の業界の俯瞰図、例えば、証券・金融業界の各企業についての俯瞰図等を画面表示することもできる。なお、統合報告書データ等の企業文書データや、この企業文書データから作成される企業文データ、企業文ベクトル、関連スコア、代表関連スコアを、業界毎に用意するか(業界識別情報に関連付けて用意するか)、ある業界だけについて用意してもよい。その場合は、企業文書データ記憶手段56、企業文データ記憶手段57、企業文ベクトル記憶手段58、関連スコア記憶手段59、代表関連スコア記憶手段60を、業界毎に用意するか(業界識別情報に関連付けて用意するか)、ある業界だけについて用意すればよい。
【0120】
<出力手段41/企業間取組比較リスト表示処理:
図8、
図6>
【0121】
図8において、出力手段41により表示される企業間取組比較リスト表示画面130には、テーマ選択部131と、サブテーマ選択部132と、企業(企業名)を選択する企業選択部133と、比較する企業(企業名)を選択する比較企業選択部134と、表示したいテキスト(企業文データ)の関連スコアの閾値を設定する閾値設定部135と、選択した企業(
図8の例では、B社)の企業文データ表示部140および取組リスト表示部141と、選択した比較企業(
図8の例では、X社)の企業文データ表示部142および取組リスト表示部143とが設けられている。
【0122】
テーマ選択部131およびサブテーマ選択部132には、
図7の俯瞰図表示画面100のサブテーマ選択部105でユーザによるサブテーマの選択指定があれば、そのサブテーマおよびそれが帰属するテーマが自動選択されている状態となる。企業選択部133および比較企業選択部134にも、
図7の俯瞰図表示画面100の企業選択部103でユーザによる2つの企業の選択指定があれば、それらの2企業が自動選択されている状態となる。
【0123】
閾値設定部135で指定された閾値以上または閾値を超える関連スコアを有する企業文データが、企業文データ表示部140,142に表示される。この際、閾値以上または閾値を超える関連スコアの企業文データの全部を表示する場合には、表示枠内に収まらない部分は、スクロールして見ることができる。一方、閾値以上または閾値を超える関連スコアの企業文データのうち、関連スコアの大きさが予め定められた件数の上位(例えば上位10件)の企業文データだけを表示するようにしてもよい。
【0124】
出力手段41は、企業選択部133でユーザが選択した企業の企業識別情報、およびサブテーマ選択部132でユーザが選択したサブテーマのサブテーマ識別情報に関連付けられて関連スコア記憶手段59(
図5参照)に記憶されている関連スコアのうち、閾値設定部135で設定された条件を満たす関連スコアを、関連スコアが高い順に企業文データ表示部140に表示する。また、出力手段41は、関連スコア記憶手段59から、その関連スコアに関連付けられた企業識別情報および企業文識別情報を取得し、それらの企業識別情報および企業文識別情報に関連付けられて企業文データ記憶手段57(
図5参照)に記憶されている企業文データおよび年度を、その関連スコアに対応させて企業文データ表示部140の同じ行内に表示する。なお、年度の表示は省略してもよい。
【0125】
同様に、出力手段41は、比較企業選択部134でユーザが選択した比較企業の企業識別情報、およびサブテーマ選択部132でユーザが選択したサブテーマのサブテーマ識別情報に関連付けられて関連スコア記憶手段59(
図5参照)に記憶されている関連スコアのうち、閾値設定部135で設定された条件を満たす関連スコアを、関連スコアが高い順に企業文データ表示部142に表示する。また、出力手段41は、関連スコア記憶手段59から、その関連スコアに関連付けられた企業識別情報および企業文識別情報を取得し、それらの企業識別情報および企業文識別情報に関連付けられて企業文データ記憶手段57(
図5参照)に記憶されている企業文データおよび年度を、その関連スコアに対応させて企業文データ表示部142の同じ行内に表示する。なお、年度の表示は省略してもよい。
【0126】
また、出力手段41は、企業文データ表示部140,142に表示した2企業のそれぞれについての関連スコアの大きさが上位の複数件(例えば上位10件)の企業文データを、企業取組文取得手段42に渡し、その後、企業取組文取得手段42から複数の取組文データをリスト形式で受け取り、受け取った複数の取組文データを、リスト形式で取組リスト表示部141,143に表示する。
【0127】
さらに、
図8の企業間取組比較リスト表示画面130には、俯瞰図表示画面100(
図7参照)に移動するための「俯瞰図表示」ボタン150と、各社取組文表示画面160(
図9参照)に移動するための「各社取組文表示」ボタン151と、類似文検索画面200(
図10参照)に移動するための「類似文検索」ボタン152と、推薦画面230(
図12参照)に移動するための「推薦」ボタン153と、ファクトイド型質問画面300(
図6参照)に移動するための「ファクトイド型質問」ボタン154と、キーワード検索画面310(
図6参照)に移動するための「キーワード検索」ボタン155とが設けられている。
【0128】
取組リスト表示部141,143にリスト形式で表示された複数の取組文のうちのいずれかを選択してクリックすると、その取組文データが、類似文検索処理(
図10参照)に使用される(
図6参照)。
【0129】
【0130】
図9において、出力手段41により表示される各社取組文表示画面160には、テーマ選択部161と、サブテーマ選択部162と、企業文データ表示部170と、取組リスト表示部171とが設けられている。
【0131】
また、テーマ選択部161およびサブテーマ選択部162には、
図7の俯瞰図表示画面100のサブテーマ選択部105でユーザによるサブテーマの選択指定があれば、そのサブテーマおよびそれが帰属するテーマが自動選択されている状態となる。
【0132】
企業文データ表示部170には、年度と、企業識別情報(銘柄名や銘柄コード等)と、経済産業省による企業の取組に対する総合評価点および総合偏差値と、サブテーマ選択部162で選択されたサブテーマに対する関連スコアと、テキスト(企業文データ)とが対応した状態で表示される。なお、総合評価点および総合偏差値に加えて、またはこれらに代えて、企業の取組に対する他の評価者・評価団体(政府や地方公共団体であるか、民間であるかは問わない。)による評価点や偏差値を表示してもよい。他の評価者・評価団体による評価点や偏差値としては、例えば、企業毎に複数の項目で点数付けを行ったウェルビーイングレポート等がある。
【0133】
この
図9の各社取組文表示画面160では、
図8の企業間取組比較リスト表示画面130とは異なり、企業が指定されていないので、企業文データ表示部170には、サブテーマ選択部162で選択されたサブテーマに対する複数の企業についての取組内容(企業文データ)が混在した状態で表示される。
【0134】
具体的には、出力手段41は、サブテーマ選択部162でユーザが選択したサブテーマのサブテーマ識別情報に関連付けられて関連スコア記憶手段59(
図5参照)に記憶されている関連スコアを、その値が高い順に企業文データ表示部170に表示する。また、出力手段41は、関連スコア記憶手段59から、その関連スコアに関連付けられた企業識別情報および企業文識別情報を取得し、それらの企業識別情報および企業文識別情報に関連付けられて企業文データ記憶手段57(
図5参照)に記憶されている企業文データおよび年度を、その関連スコアに対応させて企業文データ表示部170の同じ行内に表示する。なお、年度の表示は省略してもよい。
【0135】
さらに、出力手段41は、企業識別情報に関連付けられて調査票データ記憶手段51や企業文書データ記憶手段56に記憶されている総合評価点や総合偏差値、あるいはその他の評価点や偏差値を取得し、企業文データ表示部170に表示する。なお、総合評価点や総合偏差値は、調査票を提出していない企業についてはデータがないので、空欄となる。
【0136】
また、出力手段41は、企業文データ表示部170に表示した関連スコアの大きさが上位の複数件(例えば上位10件)の企業文データを、企業取組文取得手段42に渡し、その後、企業取組文取得手段42から複数の取組文データをリスト形式で受け取り、受け取った複数の取組文データを、リスト形式で取組リスト表示部171に表示する。
【0137】
さらに、
図9の各社取組文表示画面160には、俯瞰図表示画面100(
図7参照)に移動するための「俯瞰図表示」ボタン180と、企業間取組比較リスト表示画面130(
図8参照)に移動するための「企業間取組比較リスト表示」ボタン181と、類似文検索画面200(
図10参照)に移動するための「類似文検索」ボタン182と、推薦画面230(
図12参照)に移動するための「推薦」ボタン183と、ファクトイド型質問画面300(
図6参照)に移動するための「ファクトイド型質問」ボタン184と、キーワード検索画面310(
図6参照)に移動するための「キーワード検索」ボタン185とが設けられている。
【0138】
取組リスト表示部171にリスト形式で表示された複数の取組文のうちのいずれかを選択してクリックすると、その取組文データが、類似文検索処理(
図10参照)に使用される(
図6参照)。
【0139】
<出力手段41/類似文検索処理、類似サブテーマ表示処理、統合関連スコア順表示処理、調整関連スコア順表示処理:
図10、
図11、
図6>
【0140】
図10において、出力手段41により表示される類似文検索画面200には、ユーザによる任意の検索用文字列データ(テキストデータ)の入力を受け付ける検索用文字列入力部201と、この検索用文字列入力部201に入力された検索用文字列データによる企業文データの検索を開始する「検索実行」ボタン202と、入力された検索用文字列(「検索実行」ボタン202の押下により実際に検索に使用された検索用文字列)の表示部203と、企業文データ表示部204と、この企業文データ表示部204の中の企業選択部205と、取組リスト表示部206とが設けられている。
【0141】
また、検索用文字列入力部201には、
図8の企業間取組比較リスト表示画面130、
図9の各社取組文表示画面160、
図12の推薦画面230、あるいはこの
図10の類似文検索画面200自身で、ユーザによる取組リスト表示部141,143,171,206,242,243からの取組文データの選択指定があれば、その選択指定された取組文データが、検索用文字列データとして自動入力されている状態となる。
【0142】
また、
図10の例では、検索用文字列入力部201には、「企業文書(統合報告書等)から類似検索したい文字列(文または単語)を入力してください」と記載されているが、「検索実行」ボタン202を押し下げて実際に検索に使用された検索用文字列(
図10の例では「ウェアラブル端末」)は、検索用文字列の表示部203に表示されているので、この検索用文字列の入力を促す表示は、さらに次の検索用文字列データの入力を促す表示である。そして、この
図10の類似文検索画面200の取組リスト表示部206で、ユーザによる取組文データの選択指定があれば、選択指定された取組文データが、検索用文字列入力部201に自動入力された状態となり、その状態で「検索実行」ボタン202を押し下げると、選択指定された取組文データを新たな検索用文字列データとして検索処理が実行されるので、この
図10の類似文検索画面200の中だけでの繰り返しの検索処理も可能となっている(
図6参照)。
【0143】
図10の企業文データ表示部204には、年度と、企業識別情報(銘柄名や銘柄コード等)と、関連スコアと、テキスト(企業文データ)とが対応した状態で表示される。但し、この
図10の企業文データ表示部204の関連スコアは、最初の表示(ソートする前の表示)では、
図8の企業文データ表示部140,142や
図9の企業文データ表示部170の場合とは異なり、各企業文データについてのサブテーマに対する関連スコアではなく、各企業文データについての検索用文字列データに対する関連スコアであり、本願(特に、本願の請求項)では、これを入力文字列関連スコアと呼んで、サブテーマに対する関連スコアと区別している。
【0144】
出力手段41は、
図11に示すように、最初の表示(ソートする前の表示)では、類似文検索処理を実行する。この類似文検索処理では、検索用文字列入力部201でユーザによる任意の検索用文字列データの入力(
図8、
図9、
図10、
図12の取組リスト表示部141,143,171,206,242,243でユーザにより選択指定された取組文データが、検索用文字列データとして自動入力される場合を含む。)を受け付け、入力された検索用文字列データを回答文データのベクトル化処理で使用した方法と同じ方法(本実施形態では、例えば、Azure OpenAI Embeddings API text-embedding-ada-002 version2)によるベクトル化処理によりベクトル化し、得られた検索用文字列ベクトルと、企業文データ記憶手段57に記憶された複数の企業文データをベクトル化した複数の企業文ベクトル(すなわち、企業文ベクトル記憶手段58に記憶された複数の企業文ベクトル)のそれぞれとの類似度(本実施形態では、コサイン類似度)を算出することにより、複数の企業文データのそれぞれについての検索用文字列データに対する入力文字列関連スコアを求め、求めた入力文字列関連スコアが高い順に、企業文データを並べて企業文データ表示部204に表示する。企業文データ表示部204への表示数は、予め定められた件数(例えば、上位10件など)としてもよく、あるいは、最初に例えば上位10件の企業文データを表示し、その後、次々に、入力文字列関連スコアが高い企業文データを例えば10件ずつ表示してくようにしてもよく、画面をスクロールすることにより、入力文字列関連スコアが高いものから低いものへと全ての企業文データを表示できるようにしてもよい。
【0145】
より具体的には、出力手段41は、求めた入力文字列関連スコアを、その値が高い順に、企業文データ表示部204の「関連スコア」の欄に表示するとともに、入力文字列関連スコアを求める際に用いた企業文ベクトルに対応する企業文識別情報に関連付けられて企業文データ記憶手段57(
図5参照)に記憶されている企業文データ、年度、および企業識別情報(銘柄名や銘柄コード等)を企業文データ表示部204の同じ行に表示する。
【0146】
また、出力手段41は、企業文データ表示部204に表示した入力文字列関連スコアの大きさが上位の複数件(例えば上位10件)の企業文データを、企業取組文取得手段42に渡し、その後、企業取組文取得手段42から複数の取組文データをリスト形式で受け取り、受け取った複数の取組文データを、リスト形式で取組リスト表示部206に表示する。
【0147】
さらに、
図10の類似文検索画面200には、検索用文字列の表示部203に表示された検索用文字列データ、すなわち「検索実行」ボタン202を押し下げて実際に検索に使用された検索用文字列データ(
図10の例では「ウェアラブル端末」)に類似するサブテーマを表示する類似サブテーマ表示部210と、この類似サブテーマ表示部210に表示された類似のサブテーマのそれぞれの重み(
図10の例では、0%、10%、40%、20%であるが、必ずしも%の数値で入力する必要はない。)を入力する類似サブテーマ重み入力部211と、検索用文字列の表示部203に表示された検索用文字列データの重み(
図10の例では、30%であるが、必ずしも%の数値で入力する必要はない。)を入力する検索用文字列重み入力部212と、企業文データ表示部204における企業文データの表示順を様々な方法でソートするための表示順選択部213と、企業文データの表示順を変更するための「ソート実行」ボタン214とが設けられている。
【0148】
出力手段41は、最初の表示(ソートする前の表示)のための類似文検索処理を実行した後に、
図11に示すように、類似サブテーマ表示処理を実行する。この類似サブテーマ表示処理では、検索用文字列ベクトルと、サブテーマ情報記憶手段55に記憶された複数のサブテーマについてのトピックベクトルのそれぞれとの類似度(本実施形態では、コサイン類似度)を算出することにより、検索用文字列ベクトルに対する類似度が予め定められた閾値よりも大きいか若しくは閾値以上のトピックベクトルのサブテーマを抽出するか、または、類似度の大きさが予め定められた件数の上位(例えば上位5件)のトピックベクトルのサブテーマを抽出し、抽出したサブテーマを類似サブテーマ表示部210に画面表示してユーザに提示する。
図10および
図11の例では、サブテーマ[1-2]、[1-1]、[4-1]、[4-4]の4つのサブテーマが提示されている。
【0149】
また、出力手段41は、上記の類似サブテーマ表示処理を実行した後に、
図10の表示順選択部213でユーザが選択した方法により、企業文データ表示部204における企業文データの表示順を変更する。ユーザは、表示順選択部213において、類似サブテーマ重み入力部211および検索用文字列重み入力部212におけるユーザによる入力指定割合(重み)でサブテーマとの関連性を加味してソートする方法と、類似サブテーマ表示部210に表示された類似の各サブテーマに対する類似度だけでソートする方法(
図10の例では、サブテーマ「1-2 健康推進」に対する類似度だけでソート、サブテーマ「1-1 健康管理の強化」に対する類似度だけでソート、サブテーマ「4-1 メンタルヘルス対策」に対する類似度だけでソート、サブテーマ「4-4 ストレス緩和取り組み」に対する類似度だけでソートする各方法がある。)と、入力された検索用文字列データに対する類似度による表示順(最初の表示順)に戻す方法とを選択できるようになっている。
【0150】
表示順選択部213において、ユーザによる入力指定割合(重み)でサブテーマとの関連性を加味してソートする方法を選択し、「ソート実行」ボタン214を押し下げる場合には、ユーザは、類似サブテーマ重み入力部211および検索用文字列重み入力部212に、割合(重み)を入力する。この場合、出力手段41は、
図11に示すように、統合関連スコア順表示処理、または調整関連スコア順表示処理を実行する。ここでは、検索用文字列重み入力部212に入力された割合(重み)を、α(
図10の例では、30%)とし、類似サブテーマ重み入力部211に入力されたサブテーマ[1-2]、[1-1]、[4-1]、[4-4]の割合(重み)を、β(
図10の例では、0%)、γ(
図10の例では、10%)、δ(
図10の例では、40%)、ε(
図10の例では、20%)とする。なお、これらの割合(重み)の入力指定がない状態で、ユーザによる入力指定割合(重み)でサブテーマとの関連性を加味してソートする方法が選択され、「ソート実行」ボタン214が押し下げられた場合には、各割合(重み)を均等とみなす。すなわち、a=β=γ=δ=ε=20%とみなす。
【0151】
図11において、出力手段41による統合関連スコア順表示処理を実行してソートする場合は、最初の表示(ソートする前の表示)のための類似文検索処理で求めた入力文字列関連スコアと、類似サブテーマ表示処理により提示された少なくとも1つのサブテーマ(
図10の例では、4つのサブテーマ)の中からユーザにより選択された少なくとも1つのサブテーマ(
図10の例では、サブテーマ[1-2]の割合(重み)が0%と入力されているので、残りの3つのサブテーマ[1-1]、[4-1]、[4-4]が選択されている。)のサブテーマ識別情報に関連付けられて関連スコア記憶手段59(
図5参照)に記憶された関連スコアとを用いて、複数の企業文データのそれぞれについて、入力文字列関連スコアおよび少なくとも1つの関連スコアを用いてこれらの平均値若しくは加重平均値またはその他の演算値(本実施形態では、加重平均値)を求め、これを統合関連スコアとし、この統合関連スコアの高い順に、企業文データを並べ替えて企業文データ表示部204に表示する。
【0152】
すなわち、
図11において、4つのサブテーマ[1-2]、[1-1]、[4-1]、[4-4]が選択されているとすると、関連スコア記憶手段59(
図5参照)には、複数の企業文データの各々についてのサブテーマ[1-2]に対する関連スコア(複数の企業文ベクトルの各々とサブテーマ[1-2]のトピックベクトルとの類似度)が記憶され、同様に、複数の企業文データの各々についてのサブテーマ[1-1]、[4-1]、[4-4]の各々に対する関連スコア(複数の企業文ベクトルの各々とサブテーマ[1-1]、[4-1]、[4-4]のトピックベクトルの各々との類似度)が記憶されている。従って、任意の1つの企業文データについての統合関連スコアの算出式は、次のようになる。
【0153】
統合関連スコア={入力文字列関連スコア×α+サブテーマ[1-2]に対する関連スコア×β+サブテーマ[1-1]に対する関連スコア×γ+サブテーマ[4-1]に対する関連スコア×δ+サブテーマ[4-4]に対する関連スコア×ε}/(α+β+γ+δ+ε)
【0154】
また、
図11において、出力手段41による調整関連スコア順表示処理を実行してソートする場合は、最初の表示(ソートする前の表示)のための類似文検索処理で求めた検索用文字列ベクトルと、類似サブテーマ表示処理により提示された少なくとも1つのサブテーマ(
図10の例では、4つのサブテーマ)の中からユーザにより選択された少なくとも1つのサブテーマ(
図10の例では、サブテーマ[1-2]の割合(重み)が0%と入力されているので、残りの3つのサブテーマ[1-1]、[4-1]、[4-4]が選択されている。)のサブテーマ識別情報に関連付けられてサブテーマ情報記憶手段55に記憶された少なくとも1つのトピックベクトル(
図10の例では、残りの3つのサブテーマ[1-1]、[4-1]、[4-4]のトピックベクトル)とを用いて、それぞれのベクトルの要素の平均値若しくは加重平均値またはその他の演算値(本実施形態では、加重平均値)を求めて合成ベクトルを作成し、この合成ベクトルと、企業文データ記憶手段57(
図5参照)に記憶された複数の企業文データをベクトル化した複数の企業文ベクトル(すなわち、企業文ベクトル記憶手段58に記憶された複数の企業文ベクトル)のそれぞれとの類似度を算出することにより、複数の企業文データのそれぞれについての調整関連スコアを求め、この調整関連スコアの高い順に、企業文データを並べ替えて企業文データ表示部204に表示する。合成ベクトルの算出式は、次の通りである。
【0155】
合成ベクトル={検索用文字列ベクトル×α+サブテーマ[1-2]のトピックベクトル×β+サブテーマ[1-1]のトピックベクトル×γ+サブテーマ[4-1]のトピックベクトル×δ+サブテーマ[4-4]のトピックベクトル×ε}/(α+β+γ+δ+ε)
【0156】
表示順選択部213において、類似サブテーマ表示部210に表示された類似の各サブテーマに対する類似度だけでソートする方法を選択し、「ソート実行」ボタン214を押し下げる場合には、ユーザは、類似サブテーマ重み入力部211および検索用文字列重み入力部212に、割合(重み)を入力する必要はない。この場合、出力手段41は、ユーザが、例えば、サブテーマ「1-2 健康推進」に対する類似度だけでソートする方法を選択したとすると、関連スコア記憶手段59(
図5参照)には、複数の企業文データの各々についてのサブテーマ[1-2]に対する関連スコア(複数の企業文ベクトルの各々とサブテーマ[1-2]のトピックベクトルとの類似度)が記憶されているので、それらの関連スコアの高い順に、企業文データを並べ替えて企業文データ表示部204に表示する。ユーザが、サブテーマ[1-1]、[4-1]、[4-4]に対する類似度だけでソートする方法を選択したときも同様である。
【0157】
さらに、
図10の類似文検索画面200には、俯瞰図表示画面100(
図7参照)に移動するための「俯瞰図表示」ボタン220と、企業間取組比較リスト表示画面130(
図8参照)に移動するための「企業間取組比較リスト表示」ボタン221と、各社取組文表示画面160(
図9参照)に移動するための「各社取組文表示」ボタン222と、推薦画面230(
図12参照)に移動するための「推薦」ボタン223と、ファクトイド型質問画面300(
図6参照)に移動するための「ファクトイド型質問」ボタン224と、キーワード検索画面310(
図6参照)に移動するための「キーワード検索」ボタン225とが設けられている。
【0158】
ユーザが企業選択部205で2つの企業を選択した状態で「企業間取組比較リスト表示」ボタン221を押し下げると、選択された企業の企業識別情報が、企業間取組比較リスト表示処理(
図8参照)に使用される(
図6参照)。ユーザが企業選択部205で3つ以上の企業を選択した状態で「俯瞰図表示」ボタン220を押し下げると、選択された企業の企業識別情報が、俯瞰図表示処理のハイライト表示107(
図7参照)に使用される(
図6参照)。
【0159】
<出力手段41/推薦画面表示処理、取組推薦サブテーマ抽出処理、着目企業取組文表示処理、推薦取組文表示処理:
図12>
【0160】
図12において、出力手段41により表示される推薦画面230には、要取組改善企業(着目企業)を選択する企業選択部231と、この企業選択部231で選択された要取組改善企業(着目企業)が取り組むべきサブテーマとして推薦する取組推薦サブテーマを決定するための「実行」ボタン232と、この「実行」ボタン232を押し下げて決定した取組推薦サブテーマを表示する取組推薦サブテーマ表示部233と、この取組推薦サブテーマ表示部233に表示された取組推薦サブテーマの中からのユーザの2以上の選択を受け付けるサブテーマ選択部234と、要取組改善企業(着目企業)の現状の取組内容(企業文データ)の表示および要取組改善企業(着目企業)への推薦取組文(企業文データ)の表示についての様々な方法の選択部235と、推薦取組文(企業文データ)の表示について総合評価点を有する企業のテキスト(企業文データ)に絞って表示することを選択する選択部236と、要取組改善企業(着目企業)の現状の取組内容(企業文データ)の表示および要取組改善企業(着目企業)への推薦取組文(企業文データ)の表示を行うための「表示」ボタン237と、この「表示」ボタン237の押下後に要取組改善企業(着目企業)の現状の取組内容(企業文データ)を表示する企業文データ表示部240および要取組改善企業(着目企業)への推薦取組文(企業文データ)を表示する推薦取組文表示部241と、要取組改善企業(着目企業)の取組リスト表示部242および推薦取組文(企業文データ)の取組リスト表示部243とが設けられている。
【0161】
そして、出力手段41により実行される
図12の推薦画面230の表示のための推薦画面表示処理には、以下の取組推薦サブテーマ抽出処理と、着目企業取組文表示処理と、推薦取組文表示処理とが含まれる。
【0162】
企業選択部231には、
図7の俯瞰図表示画面100の企業選択部103でユーザによる要取組改善企業(着目企業)の選択指定があれば、その着目企業が自動選択されている状態となる。
【0163】
ユーザにより「実行」ボタン232が押し下げられると、取組推薦サブテーマ抽出処理が実行され、要取組改善企業(着目企業)が取り組むべきサブテーマとして推薦される取組推薦サブテーマが、取組推薦サブテーマ表示部233に表示される。
【0164】
出力手段41は、取組推薦サブテーマ抽出処理を実行する際には、企業選択部231でユーザによる1つの要取組改善企業(着目企業)の選択(
図7の俯瞰図表示画面100の企業選択部103でのユーザの選択指定による自動選択の場合を含む。)を受け付け、代表関連スコア記憶手段60(
図5参照)に記憶されている代表関連スコアを用いて、サブテーマ毎に、選択された着目企業の代表関連スコアと、着目企業以外の企業の代表関連スコアのうちの最も大きい代表関連スコアとの差分を求めるか、または、選択された着目企業の代表関連スコアと、着目企業以外の企業の代表関連スコアのうちの上位の複数(例えば上位5件等の所定件数)の代表関連スコアの平均値またはその他の演算値との差分を求めることにより、着目企業の代表関連スコアについての着目企業以外の企業の代表関連スコアに対する乖離度を算出し、算出した乖離度が大きい上位の複数(例えば上位5件等の所定件数)のサブテーマを取組推薦サブテーマとして抽出して取組推薦サブテーマ表示部233に画面表示する。
【0165】
サブテーマ選択部234は、取組推薦サブテーマ表示部233に表示された取組推薦サブテーマの中から2以上のサブテーマを選択し、企業文データ表示部240および推薦取組文表示部241の表示を行う場合に使用される。従って、1つのサブテーマを選択して企業文データ表示部240および推薦取組文表示部241の表示を行う場合には、サブテーマ選択部234での選択を行う必要はない。
【0166】
選択部235では、企業文データ表示部240および推薦取組文表示部241の表示方法として、ユーザが、サブテーマ選択部234で選択された2以上のサブテーマを混在させて関連スコアの高い順に表示する方法と、取組推薦サブテーマ表示部233に表示されたサブテーマの中の1つのサブテーマに対する関連スコアの高い順に表示する方法(
図12の例では、サブテーマ「[1-2]健康推進」に対する関連スコアの高い順に表示する方法、サブテーマ「1-1]健康管理の強化」に対する関連スコアの高い順に表示する方法、サブテーマ「[4-1]メンタルヘルス対策」に対する関連スコアの高い順に表示する方法、サブテーマ「[4-4]ストレス緩和取り組み」に対する関連スコアの高い順に表示する方法がある。)とを選択することができるようになっている。
【0167】
また、企業の中には、総合評価点や総合偏差値を有する企業(調査票を提出した企業)と、それらを有しない企業(調査票を提出していない企業)とがあるので、選択部236にチェックを入れると、総合評価点や総合偏差値を有する企業の企業文データに絞って表示することができるようになっている。
【0168】
そして、ユーザが選択部235で表示方法を選択した後に、「表示」ボタン237を押し下げると、出力手段41により、着目企業取組文表示処理が実行され、企業文データ表示部240および取組リスト表示部242への表示が行われるとともに、推薦取組文表示処理が実行され、推薦取組文表示部241および取組リスト表示部243への表示が行われる。
【0169】
出力手段41は、ユーザが選択部235で選択した表示方法に従って着目企業取組文表示処理を実行する際には、関連スコア記憶手段59(
図5参照)に記憶された着目企業の企業文データについてのユーザ選択に係る取組推薦サブテーマに対する関連スコアが高い順に、企業文データ記憶手段57(
図5参照)に記憶された着目企業の企業文データおよび年度を、関連スコアとともに企業文データ表示部240に画面表示する。この際、ユーザ選択に係る取組推薦サブテーマが、2以上のサブテーマである場合には、各サブテーマに対する関連スコアを混在させた状態で表示順を決める。
【0170】
また、出力手段41は、ユーザが選択部235で選択した表示方法に従って推薦取組文表示処理を実行する際には、関連スコア記憶手段59(
図5参照)に記憶された着目企業以外の企業の企業文データについてのユーザ選択に係る取組推薦サブテーマに対する関連スコアが高い順に、企業文データ記憶手段57(
図5参照)に記憶された着目企業以外の企業の企業文データおよび年度を、企業識別情報(銘柄名や銘柄コード等)および関連スコアとともに推薦取組文表示部241に画面表示する。この際、ユーザ選択に係る取組推薦サブテーマが、2以上のサブテーマである場合には、各サブテーマに対する関連スコアを混在させた状態で表示順を決める。また、着目企業以外の企業は、複数の企業となるため、複数の企業の企業文データについての各サブテーマに対する関連スコアを混在させた状態で表示順を決める。
【0171】
そして、出力手段41は、企業文データ表示部240に表示した関連スコアの大きさが上位の複数件(例えば上位10件)の企業文データを、企業取組文取得手段42に渡し、その後、企業取組文取得手段42から複数の取組文データをリスト形式で受け取り、受け取った複数の取組文データを、リスト形式で取組リスト表示部242に表示する。同様に、出力手段41は、推薦取組文表示部241に表示した関連スコアの大きさが上位の複数件(例えば上位10件)の企業文データを、企業取組文取得手段42に渡し、その後、企業取組文取得手段42から複数の取組文データをリスト形式で受け取り、受け取った複数の取組文データを、リスト形式で取組リスト表示部243に表示する。なお、取組リスト表示部242,243には、図面の記載スペースの関係で、取組文データが1つずつしか記載されていないが、
図8の取組リスト表示部141,143の場合と同様に、それぞれに複数の取組文データがリスト形式で表示される。
【0172】
さらに、
図12の推薦画面230には、俯瞰図表示画面100(
図7参照)に移動するための「俯瞰図表示」ボタン250と、企業間取組比較リスト表示画面130(
図8参照)に移動するための「企業間取組比較リスト表示」ボタン251と、各社取組文表示画面160(
図9参照)に移動するための「各社取組文表示」ボタン252と、類似文検索画面200(
図10参照)に移動するための「類似文検索」ボタン253と、ファクトイド型質問画面300(
図6参照)に移動するための「ファクトイド型質問」ボタン254と、キーワード検索画面310(
図6参照)に移動するための「キーワード検索」ボタン255とが設けられている。
【0173】
取組リスト表示部242,243にリスト形式で表示された複数の取組文のうちのいずれかを選択してクリックすると、その取組文データが、類似文検索処理(
図10参照)に使用される(
図6参照)。
【0174】
<出力手段41/ファクトイド型質問画面300の表示処理:
図6>
【0175】
出力手段41により表示されるファクトイド型質問画面300には、ユーザによるファクトイド型質問データ(誰、何、いつ、どこで、どのくらい等を問うテキストデータ)の入力部が設けられている。出力手段41は、この入力部に入力されたファクトイド型質問データを、図示されない外部サービスを行うシステムにネットワーク1を介して送信し、外部サービスを行うシステムからの返答データを受信する。そして、ファクトイド型質問画面300には、受信した返答データを画面表示する返答データ表示部が設けられている。
【0176】
<出力手段41/キーワード検索画面310の表示処理:
図6>
【0177】
出力手段41により表示されるキーワード検索画面310には、ユーザによるキーワード検索用データ(テキストデータ)の入力部が設けられている。出力手段41は、この入力部に入力されたキーワード検索用データを、図示されない外部サービスを行うシステムにネットワーク1を介して送信し、外部サービスを行うシステムからの返答データを受信する。そして、キーワード検索画面310には、受信した返答データを画面表示する返答データ表示部が設けられている。
【0178】
<企業取組文取得手段42の構成>
【0179】
企業取組文取得手段42は、出力手段41による企業間取組比較リスト表示処理(
図8参照)、各社取組文表示処理(
図9参照)、類似文検索処理(
図10参照)、推薦画面表示処理(
図12参照)を実行する際に、画面表示されている関連スコアまたは
図10の場合には入力文字列関連スコアが大きい上位の複数件(例えば上位10件)の企業文データを出力手段41から受け取り、受け取った上位の複数件(例えば上位10件)の企業文データおよびこれらの複数件の企業文データを用いて企業の取り組みを示す複数の取組文をリスト形式で作成して欲しい旨の依頼文を記載した企業取組文作成依頼データを作成し、作成した企業取組文作成依頼データを、チャット・ジェネレイティヴ・プリトレインド・トランスフォーマ(ChatGPT)またはその他の大規模言語モデル(LLM)に入力し、この大規模言語モデル(LLM)から複数の取組文データをリスト形式で出力させ、出力されたリスト形式の複数の取組文データを出力手段41に渡す処理を実行するものである。
【0180】
具体的には、企業取組文取得手段42は、
図14に示すように、例えば、「下記の文章から企業の取り組み文を20文字以内でカンマで区切ったリスト形式で出力してください。 {message}」という企業取組文作成依頼データ(テキストデータ)を作成し、作成した企業取組文作成依頼データを、ネットワーク1を介して大規模言語モデル(LLM)によるサービス提供システム70に送信し、大規模言語モデルから返ってくるデータを受信し、受信したデータを出力手段41に渡す。
【0181】
ここで、企業取組文作成依頼データ内の{message}には、企業間取組比較リスト表示画面130(
図8参照)に表示された企業毎の上位10件のテキストデータ(上位10件の企業文データ)を入力した状態で大規模言語モデル(LLM)に渡す。すなわち、企業取組文作成依頼データは、企業毎に作成される。また、各社取組文表示画面160(
図9参照)や類似文検索画面200(
図10参照)の場合も同様である。但し、これらの画面160,200の場合は、企業毎ではなく、複数の企業を混在させた状態での上位の所定件数のテキストデータ(例えば、上位10件の企業文データ)を入力した状態で大規模言語モデル(LLM)に渡す。
【0182】
さらに、推薦画面230(
図12参照)の場合も同様である。但し、この推薦画面230の場合は、出力手段41により実行される着目企業取組文表示処理として取組リスト表示部242への表示を行う際は、着目企業である1企業についての上位10件のテキストデータ(上位10件の企業文データ)を入力した状態で大規模言語モデル(LLM)に渡し、一方、推薦取組文表示処理として取組リスト表示部243への表示を行う際は、複数の企業を混在させた状態での上位の所定件数のテキストデータ(例えば、上位10件の企業文データ)を入力した状態で大規模言語モデル(LLM)に渡す。
【0183】
<調査票データ記憶手段51の構成>
【0184】
調査票データ記憶手段51は、健康経営度調査票データ(
図2参照)またはその他の調査票データを、企業識別情報(銘柄コードや銘柄名等)と関連付けて記憶するものである。また、調査票データとともに、年度の情報、並びに、総合評価点や総合偏差値、あるいはその他の評価点や偏差値も記憶する。
【0185】
<回答文データ記憶手段52の構成>
【0186】
回答文データ記憶手段52は、
図3に示すように、各企業の各テーマの回答文データを、テーマ識別情報、企業識別情報(銘柄コードや銘柄名等)、および回答文識別情報と関連付けて記憶するものである。
【0187】
<回答文ベクトル記憶手段53の構成>
【0188】
回答文ベクトル記憶手段53は、各企業の各テーマの回答文データをベクトル化(本実施形態では、一例として1,536次元)して得られた回答文ベクトル(
図4参照)を、テーマ識別情報、企業識別情報(銘柄コードや銘柄名等)、および回答文識別情報と関連付けて記憶するものである。
【0189】
<トピックモデル記憶手段54の構成>
【0190】
トピックモデル記憶手段54は、トピック推定手段34によりテーマ毎にトピック推定処理(本実施形態では,LDA)を実行して得られた、回答文データ(i=1~n:nは回答文データの数)における各トピックの出現確率を示すトピック値(縦ベクトルπ(i)で示されるトピック分布)、および、各トピックにおける各単語の出現確率(行列β)を、テーマ毎に、トピックモデルとして記憶するものである。
【0191】
<サブテーマ情報記憶手段55の構成>
【0192】
サブテーマ情報記憶手段55は、各テーマの中の各トピックを表現するトピックベクトルと、各テーマの中の各トピック名であるサブテーマ名を、サブテーマ識別情報と関連付けて記憶するものである。
【0193】
<企業文書データ記憶手段56の構成>
【0194】
企業文書データ記憶手段56は、各企業の統合報告書データまたはその他の企業文書データを、企業識別情報(銘柄コードや銘柄名等)と関連付けて記憶するものである。また、企業文書データとともに、年度の情報、並びに、総合評価点や総合偏差値、あるいはその他の評価点や偏差値も記憶する。
【0195】
なお、統合報告書データ等の企業文書データを記載している各企業(ダッシュボードシステム10を構築するために、統合報告書データ等を収集した各企業)と、健康経営度調査票データ(
図2参照)等の調査票データへの回答を記入している各企業(トピック推定を行うために回答データを使用した各企業であり、2022年度で約2,000社)とは、一致していなくてもよく、統合報告書データ等の企業文書データを記載している企業の数の方が多くてもよく、その逆であってもよい。調査票データは、トピック推定処理に用いるため、調査票データへの回答を記入している企業の数は、適切なトピック推定を行うための多数の回答文データが得られる数である必要がある。一方、企業文書データの収集対象とする企業の数は、情報を参照・検索するユーザが満足する数である必要があるが、本システムとして機能するためには、最低限2社の企業文書データがあればよい。
【0196】
<企業文データ記憶手段57の構成>
【0197】
企業文データ記憶手段57は、
図5に示すように、企業文データ作成手段37により作成された企業文データを、企業識別情報(銘柄コードや銘柄名等)および企業文識別情報と関連付けて記憶するものである。
【0198】
<企業文ベクトル記憶手段58の構成>
【0199】
企業文ベクトル記憶手段58は、
図5に示すように、企業文ベクトル作成手段38により作成された企業文ベクトルを、企業識別情報(銘柄コードや銘柄名等)および企業文識別情報と関連付けて記憶するものである。
【0200】
<関連スコア記憶手段59の構成>
【0201】
関連スコア記憶手段59は、
図5に示すように、類似度算出手段39により求めた各サブテーマに対する関連スコアを、サブテーマ識別情報、企業識別情報(銘柄コードや銘柄名等)、および企業文識別情報と関連付けて記憶するものである。
【0202】
<代表関連スコア記憶手段60の構成>
【0203】
代表関連スコア記憶手段60は、
図5に示すように、代表関連スコア算出手段40により求めた代表関連スコアを、サブテーマ識別情報および企業識別情報(銘柄コードや銘柄名等)と関連付けて記憶するものである。
【0204】
<ダッシュボードシステム10による処理の流れ>
【0205】
このような本実施形態においては、ダッシュボードシステム10により、
図15に示すようにして健康経営を含む人的資本経営に関する情報の表示処理が行われる。
【0206】
図15において、先ず、回答文データ作成手段31により、調査票データ記憶手段51に記憶されている各企業の健康経営度調査票データ等の調査票データに含まれる回答データを用いて、句点ごとの回答文データを作成し、回答文データ記憶手段52(
図3参照)に記憶させる(ステップS1)。
【0207】
次に、回答文ベクトル作成手段32により、回答文データ記憶手段52に記憶された回答文データについて、本実施形態では、例えば、アズール・オープンAI・エンベッディングス・APIのサービス提供システム(Azure OpenAI Embeddings API text-embedding-ada-002 version2)を使用してベクトル化処理を実行し、得られた回答文ベクトル(本実施形態では、1,536次元のベクトル)を、回答文ベクトル記憶手段53に記憶させる(ステップS2)。
【0208】
続いて、トピック推定準備手段33により、回答文データ記憶手段52(
図3参照)に記憶された各企業のそれぞれの回答文データについて、テーマ毎に(
図3の例では、テーマ4)、不要な記号やタグ等(例えば、☆、(1)(環境依存の「まるいち」)、<br>等)を除去する処理、形態素解析で単語に分解し、名詞のみを抽出する処理、不要な単語を除去する処理を実行し、トピック推定を行うために必要な情報(トピック推定は、テーマ毎に行う。)として、各回答文データ(i=1~n:nはテーマ内の回答文データの数)における各単語とそれらの出現回数との関係を得る(
図15のステップS3)。
【0209】
それから、トピック推定手段34により、テーマ毎に、テーマ内の全ての回答文データ(i=1~n)における各単語とそれらの出現回数との関係を用いて、各テーマについてのトピック推定処理(本実施形態では、LDA)を実行し、
図3に示すように、回答文データ(i)における各トピックの出現確率を示すトピック値(縦ベクトルπ(i))、および、各トピックにおける各単語の出現確率(K行p列の行列β:Kはトピック数、pは単語数)を求め、このトピック推定処理で得られた縦ベクトルπ(i)で示されるトピック分布および行列βを、テーマ毎に、トピックモデルとしてトピックモデル記憶手段54に記憶させる(
図15のステップS4)。
【0210】
さらに、サブテーマ名取得手段35により、トピックモデル記憶手段54に記憶されたテーマ毎の各トピックにおける各単語の出現確率(行列β)の中から、テーマ毎で、かつ、トピック毎に出現確率の高い予め定められた個数の上位(例えば上位10個)の単語を抽出し、すなわち、行列βの各行おいて出現確率が高い例えば上位10個の単語を抽出し、抽出した複数(例えば10個)の単語を用いて、テーマ毎で、かつ、トピック毎のサブテーマ名作成依頼データを作成し(
図13参照)、作成したサブテーマ名作成依頼データを、ChatGPT等の大規模言語モデル(LLM)によるサービス提供システム70にネットワーク1を介して送信し、サービス提供システム70から返ってきたサブテーマ名(大規模言語モデルの出力)を、サブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶させる(
図15のステップS5)。
【0211】
続いて、トピックベクトル算出手段36により、
図4に示すように、テーマ毎に、テーマの中の複数のトピックの各々について、複数の回答文データの中から、トピック値が大きい予め定められた件数(U件)の上位(例えば、上位10件)の回答文データを選択抽出し、選択抽出した上位の複数件(例えば、U=10件)の回答文データのそれぞれをベクトル化して得られた複数の回答文ベクトル(本実施形態では、回答文ベクトル作成手段32により作成されて回答文ベクトル記憶手段53(
図4参照)に記憶されている1,536次元の回答文ベクトル)を用いて、それぞれのトピックを表現するトピックベクトル(本実施形態では、1,536次元のベクトルとなる。)を求め、求めたトピックベクトルを、サブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶させる(
図15のステップS6)。
【0212】
その後、企業文データ作成手段37により、
図5に示すように、企業文書データ記憶手段56に記憶されている各企業の統合報告書データ等の企業文書データのそれぞれを句点ごとの文に分割し、分割して得られた複数の企業文データを、企業識別情報(銘柄コードや銘柄名等)、および企業文データを識別する企業文識別情報と関連付けて企業文データ記憶手段57(
図5参照)に記憶させる(
図15のステップS7)。
【0213】
続いて、企業文ベクトル作成手段38により、
図5に示すように、企業文データ記憶手段57に記憶されている複数の企業文データを、それぞれベクトル化して企業文ベクトルを作成し、作成した複数の企業文ベクトルを、企業識別情報(銘柄コードや銘柄名等)および企業文識別情報と関連付けて企業文ベクトル記憶手段58に記憶させる(
図15のステップS8)。この際、企業文ベクトル作成手段38は、回答文ベクトル作成手段32による回答文データのベクトル化処理で使用した方法と同じ方法(本実施形態では、例えば、Azure OpenAI Embeddings API text-embedding-ada-002 version2)によるベクトル化処理を実行する。
【0214】
それから、類似度算出手段39により、
図5に示すように、サブテーマ毎に、企業文ベクトル記憶手段58に記憶されている複数の企業文ベクトルと、サブテーマ情報記憶手段55に記憶されている各サブテーマのトピックベクトルとの類似度(本実施形態では、コサイン類似度)を算出することにより、複数の企業文データのそれぞれについての各サブテーマに対する関連スコアを求め、求めた関連スコアを、サブテーマ識別情報、企業識別情報(銘柄コードや銘柄名等)、および企業文識別情報と関連付けて関連スコア記憶手段59に記憶させる(
図15のステップS9)。
【0215】
さらに、代表関連スコア算出手段40により、
図5に示すように、サブテーマ毎に、関連スコア記憶手段59に記憶された各サブテーマに対する関連スコアを用いて、同一の企業識別情報に関連付けられた複数の関連スコアのうちの最大値の関連スコアを抽出し、抽出した関連スコアを当該企業識別情報の企業の代表関連スコアとするか、または、値が大きい上位の複数(V個、例えば、V=5)の関連スコアを抽出し、抽出した上位の複数(V個)の関連スコアを用いて算出した平均値若しくは加重平均値またはその他の演算値を当該企業識別情報の企業の代表関連スコアとし、サブテーマ識別情報および企業識別情報(銘柄コードや銘柄名等)と関連付けて代表関連スコア記憶手段60に記憶させる(
図15のステップS10)。
【0216】
そして、出力手段41および企業取組文取得手段42により、関連スコア記憶手段59(
図5参照)に記憶された各企業の企業文データについての各サブテーマに対する関連スコアや、代表関連スコア記憶手段60(
図5参照)に記憶された各企業についての各サブテーマに対する代表関連スコアを用いて、企業文データ記憶手段57(
図5参照)に記憶された企業文データを画面表示する処理を含む各種の出力処理(
図6~
図12参照)を実行する(
図15のステップS11)。
【0217】
<本実施形態の効果>
【0218】
このような本実施形態によれば、次のような効果がある。すなわち、ダッシュボードシステム10は、健康経営度調査票データまたはその他の調査票データを用いて、テーマ毎に、トピック推定処理を行って各トピックを示すサブテーマを定め、そのサブテーマを表現するトピックベクトルを求めておき、統合報告書データまたはその他の企業文書データから作成した企業文データの企業文ベクトルと、トピックベクトルとの類似度を算出し、算出した類似度を、各企業文データについての各サブテーマに対する関連スコアとし、この関連スコアを用いて各企業文データを画面表示する出力処理を行うことができる。
【0219】
従って、健康経営度調査票データ等の調査票データの課題のテーマがトピック推定処理で自動的に細分化されるので、テーマよりも詳細な粒度のサブテーマ(各テーマの各トピック)で課題を把握し、企業文データを参照し、あるいは比較することができる。このため、ユーザは、手間や時間をかけることなく、健康経営を含む人的資本経営(非財務状況を含む)に関する各企業の取組内容を参照することができる。
【0220】
また、ダッシュボードシステム10は、代表関連スコア算出手段40を備え、出力手段41が俯瞰図表示処理を実行する構成とされているので、関連スコアを用いて各企業についての各サブテーマに対する代表関連スコアを算出し、縦横にセルを配置して形成された行列状の表示部101の一方の軸を各サブテーマとし、他方の軸を各企業とし、各セルの表示色の濃さを代表関連スコアの大きさに対応させた俯瞰図(
図7参照)を画面表示することができる。このため、各企業についての各サブテーマに対する取組の状況が、セルの色の濃淡により一目瞭然でわかるようになり、例えば、業界全体の取組状況や、企業間での取組状況の差異を容易に把握することができる。
【0221】
さらに、ダッシュボードシステム10は、大規模言語モデル(LLM)を利用するサブテーマ名取得手段35を備えているので、システム開発者の作業の手間が省けるとともに、客観的で、より適切な名称を採用することができる。すなわち、従来、トピック推定処理で、トピック名(本発明のサブテーマ名に相当する名称)を決める必要があるケースでは、トピック名を人が決めていたが、大規模言語モデルを利用して決めることにより、システム開発者が考える手間や時間を省き、かつ、多分に人の経験や思考に依拠する命名を回避することができる。
【0222】
そして、企業文データ作成手段37は、統合報告書データ等の企業文書データがPDFデータである場合には、OCR技術(例えば、Azure Form RecognizerのOCR技術)を適用してテキスト化を行うので、様々なフォーマットで作成されている企業文書データのテキスト化に際し、文字化けの発生問題を大幅に解消し、ブロックごとに文字列を抽出することができる。
【0223】
また、出力手段41は、企業間取組比較リスト表示処理(
図8参照)を実行するので、あるサブテーマについての複数の企業(本実施形態では、2つの企業)の取組状況を容易に比較することができる。
【0224】
さらに、ダッシュボードシステム10は、大規模言語モデル(LLM)を利用する企業取組文取得手段42を備えているので、企業間取組比較リスト表示画面130(
図8参照)、各社取組文表示画面160(
図9参照)、類似文検索画面200(
図10参照)、推薦画面230(
図12参照)において、企業文データ表示部140,142,170,204,240や推薦取組文表示部241に表示された関連スコア(各サブテーマに対する関連度を示す値)または
図10の場合には入力文字列関連スコア(検索用文字列データに対する関連度を示す値)が上位の複数の企業文データを用いて、大規模言語モデルにより、企業の取り組みを示す複数の取組文データをリスト形式で出力させ、それらを取組リスト表示部141,143,171,206,242,243に画面表示することができる。このため、ユーザは、より一層容易に、企業の取組内容を把握することができるとともに、類似文検索画面200(
図10参照)では、これらの取組文を、検索用文字列として利用することができる。
【0225】
また、出力手段41は類似文検索処理(
図10参照)を実行するので、複数の企業文データのそれぞれについて、ユーザが入力した任意の検索用文字列データに対する入力文字列関連スコアを求め、この入力文字列関連スコアが高い順に企業文データを表示することができる。このため、ユーザは、自分が参照したい情報を、より一層容易に表示することができる。
【0226】
さらに、出力手段41は、類似文検索処理(
図10参照)の際に、類似サブテーマ表示処理(
図11参照)を実行するので、ユーザに対し、当該ユーザが入力した任意の検索用文字列データに類似するサブテーマを提示することができる。このため、ユーザは、そのサブテーマを利用した表示方法の変更(企業文データの表示における並び順の変更等)を行うことができる。
【0227】
また、出力手段41は、類似文検索処理(
図10参照)の際に、類似サブテーマ表示処理を実行した後、統合関連スコア順表示処理(
図11参照)を実行することができるので、ユーザは、入力文字列関連スコアが高い順に並べられた企業文データを、統合関連スコアの高い順に並べ替えた状態で参照することができる。つまり、類似サブテーマ表示処理で提示されたサブテーマに対する関連スコアを加味して並べ替えた状態で参照することができる。このため、ユーザは、様々な観点で企業文データを並べ替えて参照することができる。
【0228】
さらに、出力手段41は、類似文検索処理(
図10参照)の際に、類似サブテーマ表示処理を実行した後、調整関連スコア順表示処理(
図11参照)を実行することができるので、ユーザは、入力文字列関連スコアが高い順に並べられた企業文データを、調整関連スコアの高い順に並べ替えた状態で参照することができる。つまり、類似サブテーマ表示処理で提示されたサブテーマのトピックベクトルを用いて並べ替えた状態で参照することができる。このため、ユーザは、様々な観点で企業文データを並べ替えて参照することができる。
【0229】
そして、ダッシュボードシステム10は、代表関連スコア算出手段40を備えるとともに、出力手段41が取組推薦サブテーマ抽出処理、着目企業取組文表示処理、推薦取組文表示処理を実行する構成とされているので、健康経営を含む人的資本経営に関し、取組の改善が必要な着目企業(要取組改善企業)に対する推薦取組文を画面表示することができる。このため、健康経営を含む人的資本経営に関する取組が不十分な企業や、取組内容をより一層充実させたい企業が、ユーザとなっている場合には、参考にすべき他の企業の取組内容を容易に参照することができ、効率的な情報収集を行うことができる。また、経営コンサルティングファームが、ユーザとなっている場合には、取組が不十分な企業に対し、十分な取組を行っている優良企業の取組内容を紹介する作業を、効率的に行うことができる。
【0230】
<変形の形態>
【0231】
なお、本発明は前記実施形態に限定されるものではなく、本発明の目的を達成できる範囲内での変形等は本発明に含まれるものである。
【0232】
例えば、前記実施形態では、ダッシュボードシステム10は、スタンド・アロンのシステムの状態で記載されているが、本発明のダッシュボードシステムは、ネットワークで接続されたサーバ・クライアントシステムとしてもよく、その場合は、本体20をサーバで構成し、表示手段80および入力手段81をクライアント端末に設ければよい。
【0233】
また、前記実施形態では、健康経営度調査票データに含まれる回答データ(
図2参照)を用いてトピック推定処理を行っていたが、これに限定されるものではなく、例えば、ISO30414(人的資本に関する情報開示のガイドライン)の指針の沿った調査票データ等でもよく、要するに、各企業が予め定められた課題のテーマに沿って回答したデータが含まれていて、その回答データが本システムの構築のための教師データのように機能するものであればよい。
【0234】
さらに、前記実施形態では、統合報告書データ(
図5参照)を用いて、ユーザに提示するための企業文データを作成していたが、企業文データを作成するための企業文書データは、統合報告書データに限定されるものではなく、例えば、有価証券報告書のうちの健康経営を含む人的資本経営に関する記載部分や、サステナビリティレポート等でもよく、要するに、調査票データとは異なり、各企業が企業毎の自由な記載形式で自社に関する健康経営を含む人的資本経営に関する情報を記載したものであればよい。
【0235】
また、前記実施形態では、健康経営度調査票データまたはその他の調査票データを用いてトピック推定処理を行うことにより、課題のテーマを細分化していた。より詳細には、健康経営度調査票データの場合には、経済産業省が定めた10個のテーマがあり、それらのテーマの各々についてトピック推定処理を行うことにより、各テーマを更に各トピックに分割し、それらの各テーマの中の各トピックをサブテーマと呼んでいた。従って、10個のテーマが細分化され、総計で例えば52個のサブテーマに分割されていた。
【0236】
このような調査票の課題のテーマをトピックで細分化したサブテーマに対し、別の処理(トピック推定を行わない処理)により、別のサブテーマ(以下、「拡張サブテーマ」という。)を用意し、調査票の課題のテーマを細分化したサブテーマに追加してもよい。従って、サブテーマの数が増えることになる。すなわち、トピック推定処理で得られたトピックベクトルは、前記実施形態のサブテーマ情報記憶手段55に記憶されているが、このトピックベクトルに相当する拡張サブテーマを示すベクトル(以下、「拡張サブテーマベクトル」という。)を、上記の別の処理で用意し、サブテーマ情報記憶手段55に記憶させてもよい。この場合、拡張サブテーマベクトルは、トピックベクトルと同様に、サブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶されるので、拡張サブテーマにも、当然、サブテーマ識別情報が追加で付与される。また、拡張サブテーマの名称(以下、「拡張サブテーマ名」という。)も、追加で付与されたサブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶される。なお、前記実施形態の符号を特に変える必要はないので、前記実施形態の符号をそのまま用いて説明する。
【0237】
また、このような拡張サブテーマを用意した場合、調査票の課題のテーマに相当するものはない。拡張サブテーマは、テーマを細分化して得られたものではないためである。従って、本システムの各画面におけるテーマの選択部(例えば、
図8の企業間取組比較リスト表示画面130のテーマ選択部131等)には、仮のテーマ名を表示するようにすればよい。表示する仮のテーマ名は、例えば、「拡張テーマ」、「追加テーマ」、「調査票外テーマ」等、調査票の課題の各テーマと区別することができれば、どのような名称でもよく、追加した少なくとも1つの拡張サブテーマを、これらの「拡張テーマ」等の仮のテーマに帰属させればよい。
【0238】
拡張サブテーマを用意するための上記の別の処理(トピック推定を行わない処理)は、本システムに設けられた拡張サブテーマ作成手段(不図示)により実行され、以下の処理である。
【0239】
先ず、作成したい拡張サブテーマに関する用語(以下、「拡張サブテーマ用キーワード」という。)を予め用意する。この用意は、本システムの設計者・開発者が事前(ユーザによる検索・参照処理が行われる前)に行ってもよく、管理者・運用者が事前に行ってもよく、ユーザ(他社の取組内容を知りたい会社の担当者、経営コンサルティングファームコンサルタント等)が事前に行ってもよく、検索・参照処理を行っている最中に、拡張サブテーマを設けたいと感じたユーザが、検索・参照処理を中断して行ってもよい。
【0240】
例えば、拡張サブテーマ用キーワードとして、労働生産性、女性の活躍、ファイナンシャルウェルネス等を用意する。これらの拡張サブテーマ用キーワードは、本システムのユーザが用意する場合は、自分が検索・参照して確認したいと思う各企業の取組内容に関する用語であり、本システムの設計者・開発者や、管理者・運用者が用意する場合は、本システムの使い勝手を向上させるために、ユーザの検索・参照のニーズを考慮・予想して決定した各企業の取組内容に関する用語である。
【0241】
次に、本システムの設計者・開発者や、管理者・運用者、またはユーザが用意した上記の拡張サブテーマ用キーワードをそれらの者が入力手段81で入力し、その入力を、拡張サブテーマ作成手段により受け付ける拡張サブテーマ用キーワード入力受付処理を実行する。
【0242】
それから、拡張サブテーマ作成手段は、入力された複数の拡張サブテーマ用キーワードを用いて、「以下のキーワードに対する取り組みの文章を10個生成してください。{message}」等の拡張サブテーマ用取組文作成依頼データを作成し({message}のところに、複数の拡張サブテーマ用キーワードを埋め込む。)、作成した拡張サブテーマ用取組文作成依頼データを、ネットワーク1を介して大規模言語モデル(ChatGPT等)によるサービス提供システム70に送信するとともに、サービス提供システム70で生成されてネットワーク1を介して送信(返信)されてくる所定の個数(ここでは、一例として10個とする。)の取り組みの文章(取組文データ)を受信する拡張サブテーマ用取組文取得処理を実行する。この拡張サブテーマ用取組文取得処理は、企業取組文取得手段42の処理と略同様であり、依頼文の内容、および{message}の内容が異なるだけである。
【0243】
続いて、拡張サブテーマ作成手段は、大規模言語モデル(ChatGPT等)によるサービス提供システム70から受信した所定の個数(例えば10個)の取り組みの文章(取組文データ)の各々について、前記実施形態の回答文ベクトル作成手段32による回答文データのベクトル化処理で使用した方法と同じ方法(前記実施形態では、例えば、Azure OpenAI Embeddings API text-embedding-ada-002 version2)によるベクトル化処理を実行し、所定の個数(例えば10個)の取組文ベクトルを作成する取組文ベクトル作成処理を実行する。この取組文ベクトルは、前記実施形態と同様に、例えば、1,536次元のベクトルである。
【0244】
その後、拡張サブテーマ作成手段は、作成した所定の個数(例えば10個)の取組文ベクトルの平均をとって拡張サブテーマベクトルとし、得られた拡張サブテーマベクトルを、追加で付与したサブテーマ識別情報と関連付けてサブテーマ情報記憶手段55に記憶させる拡張サブテーマベクトル作成処理を実行する。
【0245】
また、拡張サブテーマ作成手段は、拡張サブテーマ名を取得する際には、前記実施形態のサブテーマ名取得手段35(
図13参照)を用いることができる。すなわち、拡張サブテーマ作成手段は、上記の拡張サブテーマ用取組文作成依頼データの{message}に埋め込んだ拡張サブテーマ用キーワード(例えば、労働生産性、女性の活躍、ファイナンシャルウェルネス等)を、サブテーマ名作成依頼データ(
図13参照)に埋め込んで大規模言語モデル(ChatGPT等)によるサービス提供システム70に渡すことにより、拡張サブテーマ名を取得することができる。
【0246】
なお、サブテーマ情報記憶手段55に記憶された拡張サブテーマベクトルは、トピックベクトルに相当するものであるから、類似度算出手段39による処理でも、トピックベクトルと同様に扱われる。すなわち、類似度算出手段39は、複数の企業文ベクトルと、サブテーマ情報記憶手段55に記憶された拡張サブテーマベクトル(前記実施形態の各サブテーマのトピックベクトルに相当するもの)との類似度を算出することにより、複数の企業文データのそれぞれについての拡張サブテーマ(前記実施形態の各サブテーマに相当するもの)に対する関連スコアを求める。そして、求めた拡張サブテーマに対する関連スコアを、追加で付与したサブテーマ識別情報、企業識別情報、および企業文識別情報と関連付けて関連スコア記憶手段60に記憶させる。また、代表関連スコア算出手段40の処理でも、前記実施形態の場合と同様に扱われ、関連スコア記憶手段60に記憶された拡張サブテーマ(前記実施形態の各サブテーマに相当するもの)に対する関連スコアを用いて、代表関連スコアを求め、代表関連スコア記憶手段60に記憶させる。従って、
図7の俯瞰図表示画面100のサブテーマ名の表示部104には、拡張サブテーマ名が追加表示される。
【0247】
以上により、任意のサブテーマを構築し、拡張サブテーマとすることができる。例えば、前記実施形態のように課題のテーマを細分化して得られたサブテーマ(各テーマの中の各トピック)の総数が、52個であったとすると、1つの拡張サブテーマを加えれば、ユーザに対し、53個のサブテーマを用意し、提供することができる。また、拡張サブテーマの作成個数は、1つに限らず、2以上であってもよいので、54個目、55個目、…のサブテーマを用意し、提供することができる。このため、ユーザのニーズに沿ったシステムを構築することができ、システムの利便性を向上させることができる。
【産業上の利用可能性】
【0248】
以上のように、本発明のダッシュボードシステムおよびプログラムは、例えば、健康保険組合の事業主企業の人事部や経営企画部、経営コンサルティングファームコンサルタントの業務効率化や高度化を図る場合等に用いるのに適している。
【符号の説明】
【0249】
1 ネットワーク
10 ダッシュボードシステム
31 回答文データ作成手段
32 回答文ベクトル作成手段
34 トピック推定手段
35 サブテーマ名取得手段
36 トピックベクトル算出手段
37 企業文データ作成手段
38 企業文ベクトル作成手段
39 類似度算出手段
40 代表関連スコア算出手段
41 出力手段
42 企業取組文取得手段
51 調査票データ記憶手段
52 回答文データ記憶手段
53 回答文ベクトル記憶手段
54 トピックモデル記憶手段
55 サブテーマ情報記憶手段
56 企業文書データ記憶手段
57 企業文データ記憶手段
58 企業文ベクトル記憶手段
59 関連スコア記憶手段
60 代表関連スコア記憶手段
70 大規模言語モデル(LLM)によるサービス提供システム
【要約】
【課題】健康経営を含む人的資本経営に関する各企業の情報を容易に参照することができるダッシュボードシステムを提供する。
【解決手段】ダッシュボードシステム10では、健康経営度調査票データ等の調査票データから得られた複数の回答文データを用いてテーマ毎にトピック推定処理を実行し、各回答文データのトピック分布を求め、トピック値が上位の回答文データの回答文ベクトルを用いてトピックベクトルを求めてサブテーマ情報記憶手段55に記憶しておき、類似度算出手段39により、統合報告書データ等の企業文書データから作成した複数の企業文データの企業文ベクトルと、各サブテーマのトピックベクトルとの類似度を算出して関連スコアとし、出力手段41により、関連スコアを用いて企業文データを画面表示する。
【選択図】
図1