(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024145700
(43)【公開日】2024-10-15
(54)【発明の名称】情報処理装置、データ生成装置、情報処理システム、プログラム、及び、推論モデルを生産するための方法
(51)【国際特許分類】
G06Q 10/0635 20230101AFI20241004BHJP
G06F 40/279 20200101ALI20241004BHJP
G06F 40/216 20200101ALI20241004BHJP
【FI】
G06Q10/0635
G06F40/279
G06F40/216
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023058165
(22)【出願日】2023-03-31
(71)【出願人】
【識別番号】302064762
【氏名又は名称】株式会社日本総合研究所
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】工藤 剛
(72)【発明者】
【氏名】門脇 一真
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA20
5L049AA20
(57)【要約】 (修正有)
【課題】評価支援のための情報処理装置、情報処理システム、プログラム及び推論モデルを生産するための方法を提供する。
【解決手段】評価支援システム100において、ユーザ端末120の制御部130は、1以上の条件を取得する条件取得部と、複数の文を含む文書を取得する文書取得部と、を備える。解析サーバの解析部144は、文書に含まれる複数の文の中から、1以上の条件のそれぞれに関連する1以上の文又は文字列を抽出する抽出部であって、1以上の条件と、複数の文の少なくとも一部を構成する複数の文字列、複数の文又は文書を構成する1以上の構成単位とを、学習済みの機械学習モデルに入力し、機械学習モデルから、複数の文字列のそれぞれ、複数の文のそれぞれ又は1以上の構成単位のそれぞれと、1以上の条件のそれぞれとが関連する度合いに関する推論結果に対応する出力を導出する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
1以上の条件を取得する条件取得部と、
複数の文を含む文書を取得する文書取得部と、
前記文書に含まれる前記複数の文の中から、前記1以上の条件のそれぞれに関連する1以上の文又は文字列を抽出する抽出部と、
を備え、
前記抽出部は、
(a)(i)前記1以上の条件と、(ii)前記複数の文の少なくとも一部を構成する複数の文字列、前記複数の文、又は、前記文書を構成する1以上の構成単位とを、学習済みの機械学習モデルに入力し、
(b)前記機械学習モデルから、前記複数の文字列のそれぞれ、前記複数の文のそれぞれ又は前記1以上の構成単位のそれぞれと、前記1以上の条件のそれぞれとが関連する度合いに関する推論結果に対応する出力を導出し、
(c)前記1以上の条件のそれぞれと、各条件に対応する前記出力により示される文又は文字列とを対応付けて出力し、
前記機械学習モデルは、複数の項目のそれぞれに対する評価者の評価結果を示す情報であって、前記複数の項目のそれぞれの内容と、前記複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報である評価結果情報を含む学習データを用いて機械学習された機械学習モデルであり、
前記複数の項目は、
第1項目と、
前記第1項目とは異なる第2項目と、
を含み、
前記学習データは、
前記第1項目に関する正例であることを示すラベルと、前記第1項目の内容と、前記第1項目に対する評価の根拠とが対応付けられた正例データと、
前記第1項目に関する負例であることを示すラベルと、前記第1項目の内容と、前記第2項目に対する評価の根拠とが対応付けられた第1負例データと、
を含む、
情報処理装置。
【請求項2】
前記抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部をさらに備え、
前記画面は、
前記1以上の条件のそれぞれの内容と、前記抽出部が抽出した前記1以上の文又は文字列とを対応付けて提示するための第1オブジェクトと、
前記ユーザから、前記1以上の条件のそれぞれの成否に関する入力を受け付けるための第2オブジェクトと、
を含む、
請求項1に記載の情報処理装置。
【請求項3】
前記抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部をさらに備え、
前記画面は、
前記1以上の条件のそれぞれの内容と、前記抽出部が抽出した前記1以上の文又は文字列とを対応付けて提示するための第1オブジェクトと、
前記ユーザから、前記1以上の条件のそれぞれに関連する文又は文字列の次の候補の提示を要求する次候補要求を受け付けるための第3オブジェクトと、
を含む、
請求項1に記載の情報処理装置。
【請求項4】
前記抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部をさらに備え、
前記画面は、
前記1以上の条件のそれぞれの内容と、前記抽出部が抽出した前記1以上の文又は文字列とを対応付けて提示するための第1オブジェクトと、
前記ユーザから、前記文書における前記1以上の文又は文字列の記載箇所、及び/又は、当該記載箇所の近傍の提示を要求する文書提示要求を受け付けるための第4オブジェクトと、
を含む、
請求項1に記載の情報処理装置。
【請求項5】
複数の項目のそれぞれに対する評価者の評価結果を示す評価結果情報を取得する評価結果取得部と、
前記評価結果情報に基づいてデータセットを生成するデータセット生成部と、
を備え、
前記評価結果情報は、前記複数の項目のそれぞれの内容と、前記複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報であり、
前記複数の項目は、
第1項目と、
前記第1項目とは異なる第2項目と、
を含み、
前記データセットは、
前記第1項目に関する正例であることを示すラベルと、前記第1項目の内容と、前記第1項目に対する評価の根拠とが対応付けられた正例データと、
前記第1項目に関する負例であることを示すラベルと、前記第1項目の内容と、前記第2項目に対する評価の根拠とが対応付けられた第1負例データと、
を含む、
データ生成装置。
【請求項6】
請求項5に記載のデータ生成装置と、
前記データ生成装置が生成した1以上の前記正例データ及び1以上の前記第1負例データを教師データとして用いて、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力する推論モデルを生成するモデル生成装置と、
を備える、
情報処理システム。
【請求項7】
コンピュータを、請求項1から請求項4までの何れか一項に記載の情報処理装置として機能させるためのプログラム。
【請求項8】
複数の項目のそれぞれに対する評価者の評価結果を示す評価結果情報を取得する評価結果取得段階と、
前記評価結果情報に基づいてデータセットを生成するデータセット生成段階と、
前記データセット生成段階において生成された1以上のデータセットを教師データとして用いて推論モデルを生成するモデル生成段階と、
を有し、
前記評価結果情報は、前記複数の項目のそれぞれの内容と、前記複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報であり、
前記複数の項目は、
第1項目と、
前記第1項目とは異なる第2項目と、
を含み、
前記データセットは、
前記第1項目に関する正例であることを示すラベルと、前記第1項目の内容と、前記第1項目に対する評価の根拠とが対応付けられた正例データと、
前記第1項目に関する負例であることを示すラベルと、前記第1項目の内容と、前記第2項目に対する評価の根拠とが対応付けられた第1負例データと、
を含み、
前記モデル生成段階は、1以上の前記正例データ及び1以上の前記第1負例データを教師データとして用いて、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力する前記推論モデルを生成する段階を有する、
推論モデルを生産する方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情情報処理装置、データ生成装置、情報処理システム、プログラム、及び、推論モデルを生産するための方法に関する。
【背景技術】
【0002】
特許文献1には、環境事故、法令違反などに係わる環境リスクを評価し、環境リスク低減と設備経済性とのトレードオフを最適化することのできる環境リスク評価システムが開示されている。
(先行技術文献)
(特許文献)
(特許文献1) 特許第6407546号公報
【発明の概要】
【課題を解決するための手段】
【0003】
本発明の第1の態様においては、情報処理装置が提供される。上記の情報処理装置は、例えば、1以上の条件を取得する条件取得部を備える。上記の情報処理装置は、例えば、複数の文を含む文書を取得する文書取得部を備える。上記の情報処理装置は、例えば、文書に含まれる複数の文の中から、1以上の条件のそれぞれに関連する1以上の文又は文字列を抽出する抽出部を備える。
【0004】
上記の情報処理装置において、抽出部は、例えば、(a)(i)1以上の条件と、(ii)複数の文の少なくとも一部を構成する複数の文字列、複数の文、又は、文書を構成する1以上の構成単位とを、学習済みの機械学習モデルに入力する。上記の情報処理装置において、抽出部は、例えば、(b)機械学習モデルから、複数の文字列のそれぞれ、複数の文のそれぞれ又は1以上の構成単位のそれぞれと、1以上の条件のそれぞれとが関連する度合いに関する推論結果に対応する出力を導出する。上記の情報処理装置において、抽出部は、例えば、(c)1以上の条件のそれぞれと、各条件に対応する出力により示される文又は文字列とを対応付けて出力する。
【0005】
上記の何れかの情報処理装置において、機械学習モデルは、複数の項目のそれぞれに対する評価者の評価結果を示す情報であって、複数の項目のそれぞれの内容と、複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報である評価結果情報を含む学習データを用いて機械学習された機械学習モデルであってよい。上記の何れかの情報処理装置において、複数の項目は、第1項目と、第1項目とは異なる第2項目とを含んでよい。上記の情報処理装置において、学習データは、正例データを含んでよい。正例データは、第1項目に関する正例であることを示すラベルと、第1項目の内容と、第1項目に対する評価の根拠とが対応付けられたデータであってよい。上記の何れかの情報処理装置において、学習データは、第1負例データを含んでよい。第1負例データは、第1項目に関する負例であることを示すラベルと、第1項目の内容と、第2項目に対する評価の根拠とが対応付けられたデータであってよい。
【0006】
上記の何れかの情報処理装置は、抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部を備えてよい。上記の何れかの情報処理装置において、画面は、第1オブジェクトを含んでよい。第1オブジェクトは、1以上の条件のそれぞれの内容と、抽出部が抽出した1以上の文又は文字列とを対応付けて提示するためのオブジェクトであってよい。上記の何れかの情報処理装置において、画面は、第2オブジェクトを含んでよい。第2オブジェクトは、ユーザから、1以上の条件のそれぞれの成否に関する入力を受け付けるためのオブジェクトであってよい。
【0007】
上記の何れかの情報処理装置は、抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部を備えてよい。上記の何れかの情報処理装置において、画面は、第1オブジェクトを含んでよい。第1オブジェクトは、1以上の条件のそれぞれの内容と、抽出部が抽出した1以上の文又は文字列とを対応付けて提示するためのオブジェクトであってよい。上記の何れかの情報処理装置において、画面は、第3オブジェクトを含んでよい。第3オブジェクトは、ユーザから、1以上の条件のそれぞれに関連する文又は文字列の次の候補の提示を要求する次候補要求を受け付けるためのオブジェクトであってよい。
【0008】
上記の何れかの情報処理装置は、抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部を備えてよい。上記の何れかの情報処理装置において、画面は、第1オブジェクトを含んでよい。第1オブジェクトは、1以上の条件のそれぞれの内容と、抽出部が抽出した1以上の文又は文字列とを対応付けて提示するためのオブジェクトであってよい。上記の何れかの情報処理装置において、画面は、第4オブジェクトを含んでよい。第4オブジェクトは、ユーザから、文書における1以上の文又は文字列の記載箇所、及び/又は、当該記載箇所の近傍の提示を要求する文書提示要求を受け付けるための第4オブジェクトであってよい。
【0009】
本発明の第2の態様においては、データ生成装置が提供される。上記のデータ生成装置は、例えば、複数の項目のそれぞれに対する評価者の評価結果を示す評価結果情報を取得する評価結果取得部を備える。上記のデータ生成装置は、例えば、評価結果情報に基づいてデータセットを生成するデータセット生成部を備える。上記のデータ生成装置において、評価結果情報は、例えば、複数の項目のそれぞれの内容と、複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報である。上記のデータ生成装置において、複数の項目は、例えば、第1項目と、第1項目とは異なる第2項目とを含む。上記のデータ生成装置において、データセットは、例えば、正例データを含む。正例データは、例えば、第1項目に関する正例であることを示すラベルと、第1項目の内容と、第1項目に対する評価の根拠とが対応付けられたデータである。上記のデータ生成装置において、データセットは、例えば、第1負例データを含む。第1負例データは、例えば、第1項目に関する負例であることを示すラベルと、第1項目の内容と、第2項目に対する評価の根拠とが対応付けられたデータである。
【0010】
本発明の第3の態様においては、情報処理システムが提供される。上記の情報処理システムは、例えば、上記の第2の態様に係る何れかのデータ生成装置を備える。上記の情報処理システムは、例えば、データ生成装置が生成した1以上の正例データ及び1以上の第1負例データを教師データとして用いて、推論モデルを生成するモデル生成装置を備える。上記の情報処理システムにおいて、推論モデルは、例えば、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力するモデルである。
【0011】
本発明の第4の態様においては、推論モデルを生産する方法が提供される。上記の方法の各段階は、例えば、コンピュータにより実行される。上記の方法は、例えば、複数の項目のそれぞれに対する評価者の評価結果を示す評価結果情報を取得する評価結果取得段階を有する。上記の方法は、例えば、評価結果情報に基づいてデータセットを生成するデータセット生成段階を有する。上記の方法は、例えば、データセット生成段階において生成された1以上のデータセットを教師データとして用いて推論モデルを生成するモデル生成段階を有する。
【0012】
上記の方法において、評価結果情報は、例えば、複数の項目のそれぞれの内容と、複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報である。上記の方法において、複数の項目は、例えば、第1項目と、第1項目とは異なる第2項目とを含む。上記の方法において、データセットは、例えば、正例データを含む。正例データは、例えば、第1項目に関する正例であることを示すラベルと、第1項目の内容と、第1項目に対する評価の根拠とが対応付けられたデータである。上記の方法において、データセットは、例えば、第1負例データを含む。第1負例データは、例えば、第1項目に関する負例であることを示すラベルと、第1項目の内容と、第2項目に対する評価の根拠とが対応付けられたデータである。
【0013】
上記の方法において、モデル生成段階は、例えば、1以上の正例データ及び1以上の第1負例データを教師データとして用いて、推論モデルを生成する段階を有する。上記の推論モデルは、例えば、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力するモデルである。
【0014】
本発明の第5の態様においては、プログラムが提供される。上記のプログラムを格納するコンピュータ可読媒体が提供されてもよい。コンピュータ可読媒体は、非一時的コンピュータ可読媒体であってもよく、コンピュータ可読記録媒体であってもよい。上記のプログラムは、コンピュータを、上記の第1の態様に係る情報処理装置として機能させるためのプログラムであってよい。上記のプログラムは、コンピュータを、上記の第2の態様に係るデータ生成装置として機能させるためのプログラムであってよい。上記のプログラムは、コンピュータを、上記の第3の態様に係る情報処理システムとして機能させるためのプログラムであってよい。上記のプログラムは、コンピュータに、上記の第4の態様に係る推論モデルを生産する方法を実行させるためのプログラムであってもよい。
【0015】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0016】
【
図1】評価支援システム100のシステム構成の一例を概略的に示す
【
図2】プロジェクト資料32の一例を概略的に示す。
【
図3】評価項目リスト34のデータ構造の一例を概略的に示す。
【
図7】制御部130の内部構成の一例を概略的に示す。
【
図8】解析部144の内部構成の一例を概略的に示す。
【
図9】入力データ生成部842の内部構成の一例を概略的に示す。
【
図10】モデル管理部146の内部構成の一例を概略的に示す。
【
図11】学習用データセット1100の生成処理の一例を概略的に示す。
【
図12】コンピュータ3000のシステム構成の一例を概略的に示す。
【発明を実施するための形態】
【0017】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。なお、図面において、同一または類似の部分には同一の参照番号を付して、重複する説明を省く場合がある。
【0018】
(評価支援システム100の概要)
図1は、評価支援システム100のシステム構成の一例を概略的に示す。本実施形態において、評価支援システム100は、例えば、ユーザ端末120と、解析サーバ140とを備える。本実施形態において、ユーザ端末120と、解析サーバ140とは、通信ネットワーク10を介して互いに情報を送受することができる。
【0019】
本実施形態において、ユーザ端末120は、例えば、通信部122と、入力部124と、出力部126と、格納部128と、制御部130とを有する。本実施形態において、解析サーバ140は、例えば、モデル格納部142と、解析部144と、モデル管理部146と、学習用データ収集部148とを有する。
【0020】
本実施形態においては、1以上のユーザ20のそれぞれが、ユーザ端末120を介して評価支援システム100にアクセスし、プロジェクト資料32及び評価項目リスト34に基づいて、評価結果資料38を作成する場合を例として、評価支援システム100の詳細の一例が説明される。より具体的には、ユーザ20が、特定の企画又は事業(プロジェクトと称される場合がある。)の詳細が記載されたプロジェクト資料32に基づいて、当該プロジェクトが環境及び/又は社会に与える影響を評価する場合を例として、評価支援システム100の詳細の一例が説明される。
【0021】
本実施形態によれば、まず、評価支援システム100が、プロジェクト資料32及び評価項目リスト34のデータの入力を受け付ける。プロジェクト資料32は、複数の文を含む。プロジェクト資料32の詳細は後述される。評価項目リスト34は、1以上の評価項目を含む。1以上の評価項目のそれぞれは、例えば、プロジェクトが環境及び/又は社会に与える影響を評価するために確認されるべき事項である。評価項目リスト34の詳細は後述される。
【0022】
一実施形態において、ユーザ20は、ユーザ端末120を操作して、プロジェクト資料32及び評価項目リスト34の少なくとも一方のデータをユーザ端末120に入力する。これにより、評価支援システム100は、プロジェクト資料32及び評価項目リスト34の少なくとも一方のデータを取得することができる。
【0023】
他の実施形態において、ユーザ20は、ユーザ端末120を操作して、プロジェクト資料32及び評価項目リスト34の少なくとも一方を特定するための情報をユーザ端末120に入力する。評価支援システム100は、ユーザ20がユーザ端末120に入力した情報に基づいて、評価支援システム100の記憶装置又は通信ネットワーク10に接続された他のコンピュータの記憶装置にアクセスし、プロジェクト資料32及び評価項目リスト34の少なくとも一方のデータを取得する。
【0024】
次に、評価支援システム100が、プロジェクト資料32の内容を解析する。例えば、まず、ユーザ端末120が、ユーザ20からの指示に従って、解析サーバ140にプロジェクト資料32の内容を解析させるための指示を、解析サーバ140に送信する。解析サーバ140は、機械学習によって学習済みのデータ(例えば、学習済みの推論モデルである。)を用いて、プロジェクト資料32の内容を解析する。
【0025】
より具体的には、解析サーバ140は、プロジェクト資料32に含まれる複数の文の中から、評価項目リスト34により示される1以上の評価項目のそれぞれに関連する1以上の文又は文字列を抽出する。解析サーバ140は、抽出結果をユーザ端末120に送信する。
【0026】
次に、ユーザ端末120は、解析サーバ140の抽出結果に基づいて支援画面36を生成する。支援画面36は、例えば、解析サーバ140の抽出結果をユーザ20に提示するために用いられる。ユーザ端末120は、生成された支援画面36をユーザ20に提示する。ユーザ20は、支援画面36を参照しながらユーザ端末120を操作して、評価結果資料38を完成させる。支援画面36及び評価結果資料38の詳細は後述される。
【0027】
一般的に、プロジェクト資料32はボリュームが大きく、また、評価者が確認すべき事項も多岐にわたる。そのため、評価者の評価業務を支援するためのシステムの構築が望まれている。しかしながら、プロジェクト資料32の体裁又はフォーマットは統一されておらず、プロジェクトごとに資料の体裁又はフォーマットが異なることも多い。そのため、ルールベースの仕組みを構築し、当該仕組みにより評価者を支援することも難しい。
【0028】
これに対して、本実施形態によれば、解析サーバ140が、機械学習によって学習済みのデータを用いてプロジェクト資料32の内容を解析する。これにより、例えば、プロジェクトごとにプロジェクト資料32の体裁又はフォーマットが異なる場合であっても、評価支援システム100は、ユーザ20の評価業務を支援することができる。また、例えば、プロジェクトごとに評価項目の内容が異なる場合であっても、評価支援システム100は、ユーザ20の評価業務を支援することができる。
【0029】
(評価支援システム100に関連する各部の概要)
本実施形態において、通信ネットワーク10は、複数の装置の間で情報を伝送する。通信ネットワーク10は、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、それらの組み合わせであってもよい。通信ネットワーク10は、インターネット、専用回線、無線通信網又はそれらの組み合わせであってもよい。通信ネットワーク10は、アドホックネットワークなどのP2Pネットワークを含んでもよい。
【0030】
無線通信網における通信方式は、移動体通信方式であってもよく、無線データ通信方式であってもよい。移動体通信方式としては、3G方式、LTE方式、4G方式、5G方式、などが例示される。無線データ通信方式としては、無線PAN方式、無線LAN方式、無線MAN方式、無線WAN方式などが例示される。無線通信網における通信方式は、各種の近距離無線通信方式であってもよい。
【0031】
本実施形態において、ユーザ端末120は、他の情報処理装置との間で情報を送受することのできる機器であればよく、その詳細は特に限定されない。ユーザ端末120は、複数の通信方式に対応してもよい。例えば、通信端末は、3G方式、LTE方式、4G方式、5G方式などの移動体通信方式と、無線LAN方式、無線MAN方式などの無線通信方式との両方の通信方式に対応する。ユーザ端末120は、携帯端末であってよい。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。
【0032】
本実施形態において、通信部122は、通信ネットワーク10を介して、解析サーバ140との間で情報を送受する。本実施形態において、入力部124は、ユーザ20からの入力を受け付ける。入力部124としては、キーボード、ポインティングデバイス、タッチパネル、マイク、音声入力装置、ジェスチャ入力装置などが例示される。本実施形態において、出力部126は、ユーザ20に情報を出力する。出力部126としては、ディスプレイ、プロジェクタ、スピーカなどが例示される。本実施形態において、制御部130は、ユーザ端末120の各部の動作を制御する。
【0033】
本実施形態において、解析サーバ140は、プロジェクト資料32の内容を解析する。上述されたとおり、解析サーバ140は、機械学習によって学習済みのデータを用いて、プロジェクト資料32の内容を解析する。
【0034】
本実施形態において、モデル格納部142は、機械学習によって生成された学習済みのデータを格納する。学習済みのデータは、モデル管理部146によって生成された機械学習モデルであってよい。学習済みのデータは、解析部144において用いられる機械学習モデルであってよい。上記の機械学習モデルは、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合い(関連度と称される場合がある。)に関する推論結果を出力する推論モデルであってよい。
【0035】
本実施形態において、解析部144は、機械学習によって学習済みのデータを用いて、プロジェクト資料32の内容を解析する。解析部144は、モデル格納部142に格納された学習済みの推論モデルを用いて、プロジェクト資料32の内容を解析してよい。
【0036】
より具体的には、解析部144は、プロジェクト資料32のデータを取得する。解析部144は、プロジェクト資料32の内容を示すテキストデータを取得してよい。また、解析部144は、評価項目リスト34のデータを取得する。解析部144は、プロジェクト資料32に含まれる複数の文の中から、1以上の評価項目のそれぞれに関連する1以上の文又は文字列を抽出する。解析部144の詳細は後述される。
【0037】
本実施形態において、モデル管理部146は、解析部144において用いられる機械学習モデルを管理する。一実施形態において、モデル管理部146は、機械学習により各種の推論モデルを生成する。他の実施形態において、モデル管理部146は、追加学習により、学習済みの推論モデルのパラメータを調整する。モデル管理部146の詳細は後述される。
【0038】
本実施形態において、学習用データ収集部148は、モデル管理部146における機械学習に用いられる各種のデータを収集する。一実施形態において、学習用データ収集部148は、ユーザ20が作成した評価結果資料38のデータを収集する。他の実施形態において、学習用データ収集部148は、評価結果資料38の作成過程において、ユーザ20がユーザ端末120に入力した指示の内容を示すデータ、及び/又は、当該指示に応じて評価支援システム100がユーザ20に提示したデータを収集する。
【0039】
(評価支援システム100の各部の具体的な構成)
評価支援システム100の各部は、ハードウェアにより実現されてもよく、ソフトウェアにより実現されてもよく、ハードウェア及びソフトウェアにより実現されてもよい。評価支援システム100の各部は、その少なくとも一部が、パーソナルコンピュータ又は携帯端末によって実現されてもよい。例えば、パーソナルコンピュータ又は携帯端末が、評価支援システム100のユーザインターフェースとして利用され得る。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウェアラブル・コンピュータなどが例示される。
【0040】
評価支援システム100を構成する構成要素の少なくとも一部がソフトウェアにより実現される場合、当該ソフトウェアにより実現される構成要素は、一般的な構成の情報処理装置において、当該構成要素に関する動作を規定したプログラムを起動することにより実現されてよい。上記の情報処理装置は、例えば、(i)各種プロセッサ(プロセッサとしては、CPU、GPUなどが例示される)、ROM、RAM、通信インターフェースなどを有するデータ処理装置と、(ii)メモリ、HDDなどの記憶装置(外部記憶装置を含む。)とを備える。上記の情報処理装置は、(iii)キーボード、タッチパネル、カメラ、マイク、各種センサ、GPS受信機などの入力装置を備えてもよく、(iv)表示装置、スピーカ、振動装置などの出力装置を備えてもよい。
【0041】
上記の情報処理装置において、上記のデータ処理装置又は記憶装置は、プログラムを格納してよい。上記のプログラムに記述された情報処理は、例えば、当該プログラムがコンピュータに読込まれることにより、当該プログラムに関連するソフトウェアと、評価支援システム100の少なくとも一部を構成する各種のハードウェア資源とが協働した具体的手段として機能する。そして、上記の具体的手段が、本実施形態におけるコンピュータの使用目的に応じた情報の演算又は加工を実現することにより、当該使用目的に応じた評価支援システム100又はその一部が構築される。
【0042】
上記のプログラムは、コンピュータ可読媒体に格納されていてもよい。上記のプログラムは、非一時的なコンピュータ可読記録媒体に格納されていてもよい。上記のプログラムは、CD-ROM、DVD-ROM、メモリ、ハードディスクなどのコンピュータ読み取り可能な媒体に記憶されていてもよく、ネットワークに接続された記憶装置に記憶されていてもよい。上記のプログラムは、コンピュータ読み取り可能な媒体又はネットワークに接続された記憶装置から、評価支援システム100の少なくとも一部を構成するコンピュータにインストールされてよい。
【0043】
上記のプログラムが実行されることにより、コンピュータが、評価支援システム100の各部の少なくとも一部として機能してもよい。上記のプログラムが実行されることにより、コンピュータが、評価支援システム100の少なくとも一部における情報処理方法を実行してもよい。上記のコンピュータは、機械学習によって学習済みのデータを記憶するための記憶部と、上記のプログラムを実行するための実行部とを備えてよい。
【0044】
コンピュータを評価支援システム100の少なくとも一部として機能させるためのプログラムは、例えば、評価支援システム100の少なくとも一部の動作を規定したモジュールを備える。上記のプログラム又はモジュールが実行されると、上記のプログラム又はモジュールは、データ処理装置、入力装置、出力装置、記憶装置等に働きかけて、コンピュータを評価支援システム100の少なくとも一部として機能させたり、コンピュータに評価支援システム100の少なくとも一部における情報処理方法を実行させたりする。
【0045】
プロジェクト資料32は、特定の企画又は事業が環境及び/又は社会に与える影響を評価するための文書の一例であってよい。評価項目リスト34に含まれる1以上の評価項目は、1以上の条件の一例であってよい。支援画面36は、画面の一例であってよい。
【0046】
プロジェクト資料32のデータは、文書の内容を示す文書データの一例であってよい。プロジェクト資料32の内容を示すテキストデータは、文書の内容を示す文書データの一例であってよい。評価項目リスト34のデータは、1以上の条件の内容を示す条件データの一例であってよい。
【0047】
評価支援システム100は、情報処理システム、情報処理装置、データ生成装置、又は、モデル生成装置の一例であってよい。ユーザ端末120は、情報処理装置の一例であってよい。制御部130は、情報処理装置の一例であってよい。解析サーバ140は、情報処理システム、情報処理装置、データ生成装置、又は、モデル生成装置の一例であってよい。解析部144は、情報処理装置又は抽出部の一例であってよい。モデル管理部146は、情報処理システム、データ生成装置又はモデル生成装置の一例であってよい。
【0048】
(別実施形態の一例)
本実施形態においては、ユーザ端末120が支援画面36を出力する場合を例として、ユーザ端末120の詳細が説明された。しかしながら、ユーザ端末120による支援の態様は、本実施形態に限定されない。他の実施形態において、ユーザ端末120は、支援画面36と同様の構成を有する書類のデータを作成し、当該データを出力してもよい。
【0049】
図2は、プロジェクト資料32の一例を概略的に示す。本実施形態において、プロジェクト資料32は、例えば、1以上の章220により構成される。本実施形態において、1以上の章220の少なくとも一部は、例えば、1以上の節230を含む。
【0050】
1以上の節230のそれぞれは、例えば、1以上の段落240を含む。1以上の節230の少なくとも一部は、1以上の段落240と、1以上の表252及び/又は1以上の図面254とを含んでもよい。1以上の段落240のそれぞれは、例えば、1以上の文242を含む。1以上の文242のそれぞれは、文字列244を含む。
【0051】
1以上の節230の少なくとも一部は、1以上の項260を含んでもよい。1以上の項260のそれぞれは、例えば、1以上の段落240を含む。1以上の項260の少なくとも一部は、1以上の段落240と、1以上の表252及び/又は1以上の図面254とを含んでもよい。
【0052】
上述されたとおり、本実施形態において、プロジェクト資料32は、複数の文242を含む。プロジェクト資料32は、複数の区画(ブロックと称される場合がある。)に分割されてもよい。プロジェクト資料32は、単一のブロックにより構成されてもよい。各ブロックの構成は特に限定されるものではないが、プロジェクト資料32は、複数の文242のそれぞれが1以上のブロックの何れか1つに属するように、1以上のブロックに区分けされる。
【0053】
章220は、文書を構成する構成単位の一例であってよい。節230は、文書を構成する構成単位の一例であってよい。段落240は、文書を構成する構成単位の一例であってよい。文242は、文書を構成する構成単位の一例であってよい。文字列244は、文書を構成する構成単位の一例であってよい。表252は、文書を構成する構成単位の一例であってよい。図面254は、文書を構成する構成単位の一例であってよい。項260は、文書を構成する構成単位の一例であってよい。ブロックは、文書を構成する構成単位の一例であってよい。
【0054】
図3は、評価項目リスト34のデータ構造の一例を概略的に示す。本実施形態において、評価項目リスト34は、1以上のレコードを有する。1以上のレコードのそれぞれは、評価項目326を格納する。
【0055】
評価項目326は、特定の事項を示す情報と、当該特定の事項が満たすべき要件を示す情報とを含む。評価項目326は、例えば、評価されるべき事項と、当該事項に関する評価の基準とを含む。例えば、「二酸化炭素の排出量は1kg/年以下である」という評価項目において、評価されるべき事項は「二酸化炭素の排出量」であり、当該事項に関する評価の基準は、「1kg/年以下」である。
【0056】
より具体的には、本実施形態において、複数のレコードのそれぞれは、評価項目ID322と、評価区分324と、評価項目326とを対応付けて格納する。評価項目ID322は、1以上の評価項目326のそれぞれを識別するための識別情報である。評価区分324は、複数の評価項目326を1以上に分類するための区分である。プロジェクトが環境及び/又は社会に与える影響の評価における評価区分324としては、環境リスク、社会リスクなどが例示される。
【0057】
評価項目326は、条件の一例であってよい。
【0058】
図4は、支援画面36の一例を概略的に示す。支援画面36は、ユーザ20と、評価支援システム100とのユーザインターフェースとして用いられる。支援画面36は、例えば、ユーザ端末120の出力部126から出力される。上述されたとおり、出力部126の動作は、制御部130により制御される。
【0059】
本実施形態において、支援画面36は、例えば、ユーザ20に対して情報を提示するための領域である提示領域420と、ユーザ20からの入力を受け付けるための領域である入力領域440とを含む。本実施形態においては、支援画面36が、提示領域420及び入力領域440が一体となったテーブルを含む場合を例として、支援画面36の詳細が説明される。
図4に示されるとおり、上記のテーブルは、1以上の評価項目424のそれぞれ又は1以上の証跡426ののそれぞれに対応する複数のレコードを含む。
【0060】
本実施形態において、提示領域420は、例えば、1以上の評価項目424のそれぞれの内容と、1以上の証跡426のそれぞれとを対応付けて提示する。1以上の評価項目424のそれぞれは、評価支援システム100が取得した評価項目リスト34に含まれる1以上の評価項目326のそれぞれに対応する。1以上の証跡426のそれぞれは、プロジェクト資料32に含まれる複数の文242のうち、1以上の評価項目424のそれぞれに対する評価の根拠となる1以上の文又は文字列(証跡と称される場合がある。)を示す。
【0061】
一実施形態において、証跡426として表示される1以上の文又は文字列は、解析部144の解析結果により決定される。証跡426は、解析部144が抽出した1以上の文又は文字列であってもよく、解析部144の出力値に基づいて決定された1以上の文又は文字列であってもよい。他の実施形態において、証跡426として表示される1以上の文又は文字列は、ユーザ20の指示により決定される。
【0062】
これらの実施形態により、証跡426として、(i)プロジェクト資料32に含まれる複数の文242のうち、1以上の評価項目424のそれぞれに関連する1以上の文又は文字列、又は、(ii)プロジェクト資料32に含まれる複数の文242のうち、1以上の評価項目424のそれぞれとの関連度の大きな1以上の文又は文字列が提示される。支援画面36においては、証跡426として、関連度の最も大きな単一の文又は文字列が提示されてもよく、関連度が予め定められた程度よりも大きな複数の文又は文字列が提示されてもよい。
【0063】
より具体的には、本実施形態において、提示領域420には、評価区分422と、評価項目424と、証跡426と、証跡の所在428とが対応付けて表示される。評価区分422としては、1以上の評価項目424のそれぞれに対応する評価区分が例示される。上記の評価区分は、評価支援システム100が取得した評価項目リスト34に含まれる1以上の評価項目326のそれぞれに対応する評価区分324であってよい。証跡の所在428としては、プロジェクト資料32において、1以上の証跡426のそれぞれが記載されている位置(記載位置と称される場合がある。)が例示される。記載位置としては、ページ番号、行番号などが例示される。
【0064】
本実施形態において、入力領域440は、例えば、1以上の評価項目424のそれぞれと、1以上の評価項目424のそれぞれに対するユーザ20の評価結果442とを対応付けて提示する。入力領域440は、1以上の証跡426のそれぞれに関連してユーザ20が実行可能な操作444の種類を提示してよい。
【0065】
入力領域440には、ユーザ20からの入力を受け付けるためのオブジェクトが配される。入力領域440には、各種の入力を受け付けるための複数の種類のオブジェクトが配されてよい。
【0066】
一実施形態によれば、入力領域440には、ユーザ20からの入力を受け付けるための1以上のオブジェクト452が配される。1以上のオブジェクト452のそれぞれは、例えば、1以上の評価項目424のそれぞれに対応する位置に配される。1以上のオブジェクト452のそれぞれは、例えば、ユーザ20から、1以上の評価項目424のそれぞれに対するユーザ20の評価結果442に関する入力を受け付けるために用いられる。
【0067】
特定の評価結果442に関する入力は、プロジェクトが当該特定の評価項目424に示される条件を満たしているか否かを示す情報であれば特に限定されない。特定の評価結果442の入力態様は特に限定されるものではないが、特定の評価結果442は、テキストにより入力されてもよく、評価の度合いを示す段階的な区分に関する複数の選択肢の中から選択されてもよい。オブジェクト452としては、テキストボックス、プルダウンリスト、ラジオボタン、チェックボックス、コンボボックスなどが例示される。
【0068】
他の実施形態によれば、入力領域440には、ユーザ20からの指示を受け付けるための1以上のオブジェクト454が配される。1以上のオブジェクト454のそれぞれは、例えば、1以上の証跡426のそれぞれに対応する位置に配される。1以上のオブジェクト454のそれぞれは、例えば、ユーザ20から、1以上の証跡426のそれぞれの次の候補の提示を要求するための指示(次候補要求と称される場合がある。)に関する入力を受け付けるために用いられる。
【0069】
例えば、ユーザ20がユーザ端末120を操作して支援画面36の上で特定のオブジェクト454をクリックすると、ユーザ20からの次候補要求が受け付けられ、オブジェクト454に埋め込まれたコマンドが実行される。上記のコマンドは、例えば、ユーザ端末120の制御部130に、支援画面36に表示されている証跡426を更新するための処理を実行させるための命令を含む。
【0070】
例えば、制御部130が、特定の評価項目424に対応する複数の文又は文字列のそれぞれの関連度に関する情報を取得している場合、上記のコマンドが実行されると、制御部130は、上記の関連度に関する情報を参照して、現在の証跡426として表示されている文又は文字列よりも関連度の小さな文又は文字列を、新たな証跡426として決定する。また、制御部130は、上記の決定結果に基づいて支援画面36の内容を更新する。これにより、支援画面36に表示されている証跡426が更新される。
【0071】
例えば、解析部144が、特定の評価項目424に対応する複数の文又は文字列のそれぞれの関連度に関する情報を記憶している場合、上記のコマンドが実行されると、制御部130は、解析部144に対して、特定の評価項目424に対応する証跡426の次の候補を出力するように要求する。解析部144は、特定の評価項目424に対応する複数の文又は文字列のそれぞれの関連度に関する情報に基づいて、現在の証跡426として表示されている文又は文字列よりも関連度の小さな文又は文字列を、新たな証跡426として決定する。解析部144は、新たな証跡426に関する情報を制御部130に送信する。制御部130が新たな証跡426に関する情報を受信すると、制御部130は、上記の情報に基づいて支援画面36の内容を更新する。これにより、支援画面36に表示されている証跡426が更新される。
【0072】
さらに他の実施形態によれば、入力領域440には、ユーザ20からの指示を受け付けるための1以上のオブジェクト456が配される。1以上のオブジェクト456のそれぞれは、例えば、1以上の証跡426のそれぞれに対応する位置に配される。1以上のオブジェクト456のそれぞれは、例えば、ユーザ20から、プロジェクト資料32の一部の領域の提示を要求するための指示(文書提示要求と称される場合がある。)に関する入力を受け付けるために用いられる。1以上のオブジェクト456のそれぞれにより提示が要求される上記の領域としては、1以上のオブジェクト456のそれぞれに対応する1以上の証跡426のそれぞれが記載されている箇所(記載箇所と称される場合がある)、及び/又は、当該記載箇所の近傍が例示される。
【0073】
例えば、ユーザ20がユーザ端末120を操作して支援画面36の上で特定のオブジェクト456をクリックすると、ユーザ20からの文書提示要求が受け付けられ、オブジェクト456に埋め込まれたコマンドが実行される。上記のコマンドは、例えば、ユーザ端末120の制御部130に、プロジェクト資料32の特定の箇所をユーザ20に提示するための処理を実行させるための命令を含む。例えば、上記のコマンドが実行されると、制御部130は、出力部126を制御して、特定のオブジェクト456に対応する証跡426の記載箇所及び/又は当該記載箇所の近傍をユーザ20に提示するための画面(文書表示画面と称される場合がある。)を出力させる。文書表示画面の詳細は後述される。
【0074】
支援画面36に含まれるテーブルは、第1オブジェクトの一例であってよい。提示領域420は、第1オブジェクトの一例であってよい。入力領域440は、第2オブジェクト、第3オブジェクト又は第4オブジェクトの一例であってよい。オブジェクト452は、第2オブジェクトの一例であってよい。オブジェクト454は、第3オブジェクトの一例であってよい。オブジェクト456は、第4オブジェクトの一例であってよい。1以上の証跡426のそれぞれは、抽出部が抽出した1以上の文又は文字列の一例であってよい。1以上の証跡426のそれぞれは、1以上の条件のそれぞれに関連する文又は文字列の一例であってよい。
【0075】
(別実施形態の一例)
本実施形態においては、支援画面36が、提示領域420及び入力領域440が一体となったテーブルを含む場合を例として、支援画面36の詳細が説明された。しかしながら、支援画面36は本実施形態に限定されない。支援画面36において、評価項目424と、解析部144により抽出された証跡426とは、任意の手法により対応付けられ得る。
【0076】
他の実施形態において、支援画面36は、解析部144により抽出された証跡426の記載箇所が強調表示されたプロジェクト資料32を提示するための領域を含む。支援画面36において、強調表示された証跡426の近傍に、証跡426に対応する評価項目424の内容が提示されてもよい。
【0077】
強調表示の態様は特に限定されるものではないが証跡426の記載箇所にマーカ又は下線が付される態様、証跡426の文字の書体、色及び/又は大きさが変更される態様などが例示される。マーカは、証跡426の記載箇所の全体を覆うように配されてもよく、証跡426の記載箇所の外側を囲むように配されてもよい。文字の書体としては、フォント、太字、斜体などが例示される。
【0078】
図5は、文書表示画面500の一例を概略的に示す。文書表示画面500は、例えば、
図4に関連して説明されたオブジェクト456に埋め込まれたコマンドが実行された場合に、出力部126のディスプレイ上に表示される。
【0079】
本実施形態において、文書表示画面500は、例えば、文書表示領域520と、評価項目表示領域540と、スクロールバー560とを含む。文書表示領域520には、プロジェクト資料32の内容が表示される。評価項目表示領域540には、評価項目の内容が表示される。本実施形態に係る文書表示画面500においては、評価項目表示領域540に表示される評価項目と、当該評価項目に対応する証跡の記載箇所とが関連付けて配置される。
【0080】
例えば、本実施形態によれば、評価項目542の横に、評価項目542に対応する証跡を含むブロック522が配置される。また、ブロック522の内部には、評価項目542に対応する証跡の位置を示すためのマーカ530が配置される。さらに、ブロック522の下には、ブロック522の次のブロックであるブロック524が配置される。これにより、ユーザ20は、文書表示画面500を参照することで、評価項目542の内容と、評価項目542に対応する証跡と、当該証跡の前後の文とを閲覧することができる。
【0081】
図6は、評価結果資料38の一例を概略的に示す。評価結果資料38は、例えば、ユーザ20が、
図4に関連して説明された支援画面36を参照して、1以上の評価項目424のそれぞれに対する評価を支援画面36の評価結果442の欄に入力することで作成される。
【0082】
本実施形態によれば、評価結果資料38が複数のレコードを含むテーブルとして提供される場合を例として、評価結果資料38の詳細が説明される。本実施形態において、上記の複数のレコードのそれぞれは、評価項目624と、評価結果632と、証跡634とを対応付けて格納する。より具体的には、複数のレコードのそれぞれは、評価区分622と、評価項目624と、評価結果632と、証跡634と、証跡の所在636を対応付けて格納する。
【0083】
本実施形態において、評価区分622は、対応する評価項目624の評価区分を示す。本実施形態において、評価項目624は、支援画面36の評価項目424に対応する。本実施形態において、評価結果632は、支援画面36の評価結果442に入力された評価結果を示す。本実施形態において、証跡634は、支援画面36においてユーザ20により評価項目424に対応する証跡として認められた文又は文字列を示す。本実施形態において、証跡の所在636は、対応する証跡634のプロジェクト資料32における記載位置を示す。
【0084】
本実施形態において、評価結果資料38の少なくとも一部は、解析サーバ140において用いられる機械学習モデルの学習用データとして用いられる。評価結果資料38の少なくとも一部は、上記の学習用データの生成に用いられてもよい。上記の学習用データの詳細は後述される。
【0085】
図7は、制御部130の内部構成の一例を概略的に示す。本実施形態において、制御部130は、例えば、解析対象特定部722と、評価項目特定部724と、解析要求出力部726と、解析結果取得部728と、評価結果生成部740とを備える。本実施形態において、評価結果生成部740は、例えば、支援画面生成部742と、ユーザ指示取得部744と、ユーザ指示応答部746と、学習用データ取得部748とを有する。
【0086】
本実施形態において、解析対象特定部722は、例えば、解析対象となるプロジェクト資料32を特定する。解析対象特定部722は、特定されたプロジェクト資料32を示す情報を、例えば、解析要求出力部726に出力する。上述されたとおり、プロジェクト資料32には、評価対象となるプロジェクトの内容が記載されている。プロジェクト資料32は、例えば、評価対象となるプロジェクトの内容を示す複数の文を含む。
【0087】
一実施形態において、ユーザ20は、入力部124にプロジェクト資料32のデータを入力する。プロジェクト資料32のデータのデータ形式は特に限定されない。解析対象特定部722は、入力部124からプロジェクト資料32のデータを取得する。これにより、解析対象となるプロジェクト資料32が特定される。
【0088】
他の実施形態において、ユーザ20は、入力部124にプロジェクト資料32の識別情報を入力する。プロジェクト資料32の識別情報は特に限定されるものではないが、プロジェクト資料32の識別情報としては、プロジェクト資料32の名称、URI(Uniform Resource Identifier)などが例示される。これにより、解析対象となるプロジェクト資料32が特定される。解析対象特定部722は、上記の識別情報に基づいて任意の記憶装置又はコンピュータにアクセスすることで、上記のプロジェクト資料32のデータを取得することができる。
【0089】
本実施形態において、評価項目特定部724は、例えば、プロジェクトを評価するための1以上の評価項目を特定する。評価項目特定部724は、1以上の評価項目のそれぞれの内容を示す評価項目リスト34を特定してもよい。解析対象特定部722は、特定された1以上の評価項目又は評価項目リスト34を示す情報を、例えば、解析要求出力部726に出力する。
【0090】
一実施形態において、ユーザ20は、入力部124に評価項目リスト34のデータを入力する。評価項目リスト34のデータのデータ形式は特に限定されない。評価項目特定部724は、入力部124から評価項目リスト34のデータを取得する。1以上の評価項目が特定される。
【0091】
他の実施形態において、ユーザ20は、入力部124に評価項目リスト34の識別情報を入力する。評価項目リスト34の識別情報は特に限定されるものではないが、評価項目リスト34の識別情報としては、評価項目リスト34の名称、URI(Uniform Resource Identifier)などが例示される。これにより、評価項目リスト34が特定される。評価項目特定部724は、上記の識別情報に基づいて任意の記憶装置又はコンピュータにアクセスすることで、上記の評価項目リスト34のデータを取得することができる。
【0092】
本実施形態において、解析要求出力部726は、プロジェクト資料32の解析を要求することを示す信号(解析要求と称される場合がある。)を、解析部144に送信する。解析要求出力部726は、解析部144に解析要求を送信することで、解析部144にプロジェクト資料32の解析処理を実行させることができる。
【0093】
解析要求は、解析対象特定部722により特定されたプロジェクト資料32を示す情報を含んでよい。解析要求は、プロジェクト資料32のデータを含んでもよい。解析要求は、評価項目特定部724により特定された1以上の評価項目又は評価項目リスト34を示す情報を含んでよい。解析要求は、評価項目リスト34のデータを含んでもよい。
【0094】
解析要求は、(a)(i)評価項目リスト34に含まれる1以上の評価項目と、(ii)プロジェクト資料32に含まれる複数の文の少なくとも一部を構成する複数の文字列、複数の文、又は、プロジェクト資料32を構成する1以上のブロックとを関連付けて、学習済みの機械学習モデルに入力するための処理を、解析部144を実現するコンピュータに実行させるための命令を含んでよい。解析要求は、(b)機械学習モデルから、複数の文字列のそれぞれ、複数の文のそれぞれ又は1以上のブロックのそれぞれと、1以上の評価項目のそれぞれとが関連する度合い(上述されたとおり、関連度と称される場合がある。)に関する推論結果に対応する出力を導出するための処理を、解析部144を実現するコンピュータに実行させるための命令を含んでよい。解析要求は、(c)1以上の評価項目のそれぞれと、各評価項目に対応する機械学習モデルからの出力により示される文又は文字列とを対応付けて出力するための処理を、解析部144を実現するコンピュータに実行させるための命令を含んでよい。
【0095】
本実施形態において、解析結果取得部728は、解析部144から、プロジェクト資料32に関する解析結果を示す情報を取得する。解析結果としては、解析サーバ140に格納された機械学習モデルの推論結果を示す情報、上記の推論結果に対応する情報などが例示される。推論結果に対応する情報は、推論結果に予め定められた情報処理を施すことで得られる情報であってよい。
【0096】
解析結果としては、(i)評価項目リスト34に含まれる1以上の評価項目と、プロジェクト資料32に含まれる複数の文字列、文又はブロックのそれぞれとの全ての組み合わせに関する関連度の推測値(スコアと称される場合がある)を示す情報、(ii)評価項目リスト34に含まれる1以上の評価項目に対する関連度が最も大きな文字列、文又はブロックを示す情報、(iii)評価項目リスト34に含まれる1以上の評価項目に対する関連度が予め定められた程度よりも大きな文字列、文又はブロックを示す情報などが例示される。上記の関連度の推測値は、推論結果の一例であってよい。上記の文字列、文又はブロックを示す情報は、推論結果に対応する情報の一例であってよい。
【0097】
本実施形態において、評価結果生成部740は、例えば、評価結果資料38を生成するための処理を実行する。評価結果生成部740は、ユーザ20とのインタラクションを通して、評価結果資料38を生成してよい。
【0098】
後述されるとおり、本実施形態において、評価結果資料38の生成過程におけるユーザ20及びユーザ端末120のインタラクションは、解析サーバ140における機械学習の学習データの生成に用いられる。そこで、評価結果生成部740は、上記のインタラクションに関する情報を収集し、収集された情報を解析サーバ140に送信してよい。
【0099】
本実施形態において、支援画面生成部742は、ユーザ20に提示される各種の画面を生成する。支援画面生成部742は、例えば、支援画面36を生成する。支援画面生成部742は、解析結果取得部728が取得した解析部144の解析結果を用いて、支援画面36を生成してよい。例えば、支援画面生成部742は、解析部144の解析結果を示すテーブルを作成する。支援画面生成部742は、ユーザからの入力を受け付けるための各種のオブジェクトを生成し、適切な位置に配置する。これにより、支援画面36が生成される。
【0100】
支援画面生成部742は、出力部126を制御して、ユーザ20に支援画面36を提示するための処理を出力部126に実行させてよい。これにより、例えば、出力部126のディスプレイに支援画面36が表示される。
【0101】
本実施形態において、ユーザ指示取得部744は、ユーザ20からの各種の指示に関する入力を取得する。上述されたとおり、ユーザ20は、支援画面36に配置された各種のオブジェクトを操作することで、各種の指示を入力する。ユーザ指示取得部744は、ユーザ20からの指示に関連する各種のイベントを検出するイベント検出部として機能する。具体的には、入力部124がユーザ20からの指示の入力を受け付けると、ユーザ指示取得部744は、当該指示の内容を示す情報を取得する。これにより、ユーザ指示取得部744は、ユーザ20からの指示に関連するイベントの発生を検出することができる。
【0102】
本実施形態において、ユーザ指示応答部746は、ユーザ指示取得部744が取得した各種の指示に対して応答する。これにより、ユーザ20に提示される画面の内容が更新され得る。
【0103】
一実施形態において、ユーザ指示応答部746は、支援画面36に提示される証跡の内容を更新する証跡更新部として機能し得る。例えば、ユーザ指示取得部744が特定の証跡426に対応するオブジェクト454がクリックされたことを検出した場合、ユーザ指示応答部746は、当該特定の証跡426として提示されるべき文又は文字列の次の候補を決定するための処理を実行する。これにより、支援画面36に表示される証跡の内容が更新される。上述されたとおり、上記の文又は文字列が提示された結果、特定のブロックが提示され得る。
【0104】
他の実施形態において、ユーザ指示応答部746は、例えば、プロジェクト資料32の特定の箇所をユーザ20に提示する文書提示部として機能し得る。例えば、ユーザ指示取得部744が特定の証跡426に対応するオブジェクト456がクリックされたことを検出した場合、ユーザ指示応答部746は、プロジェクト資料32における当該特定の証跡426の記載箇所及び/又は当該記載箇所の近傍をユーザ20に提示するための処理を実行する。
【0105】
本実施形態において、ユーザ指示応答部746は、ユーザ20とのインタラクションを通して、評価結果資料38を生成する。ユーザ指示応答部746は、生成された評価結果資料38を出力してよい。例えば、ユーザ指示応答部746は、出力部126を制御して、評価結果資料38を出力するための処理を出力部126に実行させてよい。例えば、出力部126は、評価結果資料38のデータを出力する。例えば、出力部126は、評価結果資料38の内容を示す画面を表示する。
【0106】
本実施形態において、学習用データ取得部748は、解析サーバ140における機械学習に用いられる各種のデータを収集する。一実施形態において、学習用データ取得部748は、完成した評価結果資料38のデータを取得し、解析サーバ140に送信する。学習用データ取得部748は、評価結果資料38と、評価結果資料38の作成に用いられたプロジェクト資料32及び/又は評価項目リスト34とを対応付けて、解析サーバ140に送信してよい。
【0107】
他の実施形態において、学習用データ取得部748は、評価結果資料38の生成過程におけるユーザ20及びユーザ端末120のインタラクションに関する情報を取得し、当該情報を解析サーバ140に送信する。上記のインタラクションに関する情報としては、支援画面36に配された各種のオブジェクトの操作の内容を示す情報、ユーザ20が文書表示画面500を閲覧している期間におけるユーザ20によるユーザ端末120の操作の内容を示す情報などが例示される。ユーザ20によるユーザ端末120の操作としては、クリック、ドラッグ、選択、選択解除などが例示される。
【0108】
解析対象特定部722は、文書取得部の一例であってよい。評価項目特定部724は、条件取得部の一例であってよい。解析要求出力部726は、文書取得部又は条件取得部の一例であってよい。支援画面生成部742は、画面生成部の一例であってよい。
(別実施形態の一例)
本実施形態においては、制御部130が支援画面生成部742を備える場合を例として、制御部130の詳細が説明された。しかしながら、制御部130は本実施形態に限定されない。他の実施形態において、支援画面生成部742は、解析サーバ140に配されてよい。この場合、解析結果取得部728は、解析サーバ140の解析結果として、支援画面生成部742が生成した画面のデータを取得してよい。
【0109】
図8は、解析部144の内部構成の一例を概略的に示す。本実施形態において、解析部144は、例えば、入力データ生成部842と、出力データ取得部844と、解析結果出力部846とを備える。
【0110】
本実施形態においては、解析部144が、モデル格納部142に格納されている関連度推論モデル820を用いて、プロジェクト資料32の内容を解析する場合を例として、解析部144の詳細が説明される。しかしながら、解析部144は、本実施形態に限定されない。
【0111】
本実施形態において、モデル格納部142は、関連度推論モデル820を格納する。関連度推論モデル820は、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力されると、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力する。例えば、関連度推論モデル820に、評価項目リスト34に含まれる特定の評価項目と、プロジェクト資料32に含まれる特定の文字列、文又はブロックとの組み合わせが入力されると、関連度推論モデル820は、両者の関連度の推論結果を示すスコアを出力する。
【0112】
関連度推論モデル820は、複数の項目のそれぞれに対する評価者の評価結果を示す情報であって、複数の項目のそれぞれの内容と、複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報である評価結果情報を含む学習データを用いて機械学習された機械学習モデルであってよい。上記の機械学習モデルにおいて、複数の項目は、第1項目と、第1項目とは異なる第2項目とを含んでよい。
【0113】
上記の機械学習モデルにおいて、学習データは、第1項目に関する正例であることを示すラベルと、第1項目の内容と、第1項目に対する評価の根拠とが対応付けられた正例データと、第1項目に関する負例であることを示すラベルと、第1項目の内容と、第2項目に対する評価の根拠とが対応付けられた第1負例データとを含んでよい。上記の機械学習モデルにおいて、学習データは、第1項目に関する負例であることを示すラベルと、第1項目の内容と、第1項目に対する評価の根拠が記載された文書に含まれる1以上の他の文又は文字列とが対応付けられた第2負例データをさらに含んでもよい。関連度推論モデル820に関する機械学習の詳細は後述される。
【0114】
本実施形態において、入力データ生成部842は、関連度推論モデル820に入力される入力データを生成する。入力データ生成部842は、例えば、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数の文字列、文又はブロックのそれぞれとの全ての組み合わせを生成することで、複数の入力データを生成する。
【0115】
より具体的には、入力データ生成部842は、まず、プロジェクト資料32及び評価項目リスト34を取得する。上述されたとおり、解析要求出力部726からの解析要求には、プロジェクト資料32及び評価項目リスト34のデータ又は識別情報が含まれる。これにより、入力データ生成部842は、プロジェクト資料32及び評価項目リスト34を取得することができる。
【0116】
次に、入力データ生成部842は、例えば、プロジェクト資料32を複数のブロックに分割する。上述されたとおり、プロジェクト資料32に含まれる複数の文のそれぞれは、上記の複数のブロックの何れか1つに属する。次に、入力データ生成部842は、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数のブロックのそれぞれとの全ての組み合わせを生成することで、複数の入力データを生成する。
【0117】
なお、上記の実施形態においては、入力データ生成部842が、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数のブロックのそれぞれとの全ての組み合わせを生成することで、複数の入力データを生成する場合を例として、入力データ生成部842の詳細が説明された。しかしながら、入力データ生成部842は本実施形態に限定されない。
【0118】
他の実施形態において、入力データ生成部842は、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数の文のそれぞれとの全ての組み合わせを生成することで、複数の入力データを生成してよい。さらに他の実施形態において、入力データ生成部842は、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数の文字列のそれぞれとの全ての組み合わせを生成することで、複数の入力データを生成してよい。
【0119】
本実施形態において、入力データ生成部842は、生成された複数の入力データを、関連度推論モデル820に入力する。これにより、入力データ生成部842は、評価項目及びブロックとを関連付けて、関連度推論モデル820に入力することができる。
【0120】
本実施形態において、出力データ取得部844は、関連度推論モデル820から、上記の入力データに対応する出力を導出する。例えば、出力データ取得部844は、関連度推論モデル820から、入力データにより示される評価項目及びブロックに関する複数の組み合わせに関する推論結果に対応する出力を導出する。
【0121】
例えば、関連度推論モデル820は、複数の入力データにより示される評価項目及びブロックに関する複数の組み合わせのそれぞれについて、評価項目及びブロックの関連度の推測値を、上記の推論結果として出力する。一実施形態において、関連度推論モデル820は、上記の複数の組み合わせのそれぞれに関する関連度の推測値を、上記の推論結果に対応する出力として出力する。他の実施形態において、関連度推論モデル820は、1以上の評価項目のそれぞれを示す情報と、当該評価項目に対する関連度が最も大きなブロックを示す情報とを対応付けて、上記の推論結果に対応する出力として出力する。さらに他の実施形態において、関連度推論モデル820は、1以上の評価項目のそれぞれを示す情報と、当該評価項目に対する関連度が予め定められた程度よりも大きなブロックを示す情報とを対応付けて、上記の推論結果に対応する出力として出力する。
【0122】
なお、上記の実施形態においては、出力データ取得部844が、関連度推論モデル820から、入力データにより示される評価項目及びブロックに関する複数の組み合わせに関する推論結果に対応する出力を導出する場合を例として、出力データ取得部844の詳細が説明された。しかしながら、出力データ取得部844は本実施形態に限定されない。
【0123】
他の実施形態において、出力データ取得部844は、関連度推論モデル820から、入力データにより示される評価項目及び文に関する複数の組み合わせに関する推論結果に対応する出力を導出してよい。さらに他の実施形態において、出力データ取得部844は、関連度推論モデル820から、入力データにより示される評価項目及び文字列に関する複数の組み合わせに関する推論結果に対応する出力を導出してよい。
【0124】
解析結果出力部846は、出力データ取得部844が取得した関連度推論モデル820からの出力に基づいて、プロジェクト資料32の解析結果を示す情報を生成する。例えば、解析結果出力部846は、関連度推論モデル820からの出力に基づいて、評価項目リスト34に含まれる1以上の評価項目のそれぞれに関する証跡の候補を決定する。各評価項目に関する証跡の候補としては、(i)各評価項目に対する関連度が最も大きな文字列、文若しくはブロック、(ii)各評価項目に対する関連度が大きな順に予め定められた個数の文字列、文若しくはブロック、(iii)各評価項目に対する関連度が予め定められた程度よりも大きな文字列、文若しくはブロックなどが例示される。
【0125】
解析結果出力部846は、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、各評価項目の証跡の候補となる文字列、文又はブロックとが対応付けて解析結果を生成する。例えば、解析結果出力部846は、テーブルを含む解析結果を生成する。上記のテーブルは、1以上のレコードを含む。1以上のレコードのそれぞれは、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、各評価項目の証跡の候補となる文字列、文又はブロックとを対応付けて格納する。
【0126】
なお、解析結果出力部846は本実施形態に限定されない。他の実施形態において、解析結果出力部846は、上述された支援画面生成部742の機能の少なくとも一部を有してもよい。
【0127】
関連度推論モデル820は、機械学習モデル又は推論モデルの一例であってよい。入力データ生成部842は、条件取得部又は文書取得部の一例であってよい。入力データ生成部842は、抽出部の一部の一例であってよい。出力データ取得部844は、抽出部の一部の一例であってよい。解析結果出力部846は、抽出部の一部の一例であってよい。
【0128】
図9は、入力データ生成部842の内部構成の一例を概略的に示す。本実施形態において、入力データ生成部842は、例えば、解析対象取得部922と、テキストデータ生成部924と、テキストデータ分割部926と、評価項目取得部932と、入力用データセット生成部940とを備える。
【0129】
本実施形態において、解析対象取得部922は、解析対象となるプロジェクト資料32のデータを取得する。解析対象取得部922は、例えば、
図8に関連して説明された手順に従って、プロジェクト資料32のデータを取得する。
【0130】
本実施形態において、テキストデータ生成部924は、プロジェクト資料32の内容を示すテキストデータを生成する。例えば、テキストデータ生成部924は、公知のOCR技術を利用して、プロジェクト資料32の内容を示すテキストデータを生成する。
【0131】
プロジェクト資料32に表が含まれている場合、テキストデータ生成部924は、表の内容をテキストに変換してよい。例えば、テキストデータ生成部924は、まず、表の構成を解析する。次に、テキストデータ生成部924は、表のタイトルと、各セルの値とに基づいて、表を構成する各レコードの内容をテキストに変換する。例えば、表の各行が単一のレコードを構成している場合、テキストデータ生成部924は、表の各列のタイトルと、各セルの値とに基づいて、各行のデータの内容をテキストに変換する。
【0132】
本実施形態において、テキストデータ分割部926は、プロジェクト資料32のテキストデータを複数のブロックに分割する。上述されたとおり、プロジェクト資料32は、複数の文を含む。また、複数の文のそれぞれは、複数のブロックの何れか1つに属する。
【0133】
本実施形態において、評価項目取得部932は、評価項目リスト34のデータを取得する。評価項目取得部932は、例えば、
図8に関連して説明された手順に従って、評価項目リスト34のデータを取得する。
【0134】
本実施形態において、入力用データセット生成部940は、関連度推論モデル820に入力される複数のデータにより構成される入力用データセットを生成する。入力用データセット生成部940は、例えば、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数のブロックのそれぞれとの全ての組み合わせを生成することで、複数の入力データを生成する。これにより、入力用データセットが生成される。入力用データセット生成部940は、生成された入力用データセットを関連度推論モデル820に入力してよい。
【0135】
上述されたとおり、入力用データセットは、本実施形態に限定されない。他の実施形態において、入力用データセット生成部940は、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数の文字列のそれぞれとの全ての組み合わせを生成することで、入力用データセットを生成する。さらに他の実施形態において、入力用データセット生成部940は、評価項目リスト34に含まれる1以上の評価項目のそれぞれと、プロジェクト資料32に含まれる複数の文のそれぞれとの全ての組み合わせを生成することで、入力用データセットを生成する。
【0136】
図10は、モデル管理部146の内部構成の一例を概略的に示す。本実施形態において、モデル管理部146は、データ格納部1020と、学習用データセット生成部1040と、学習部1060とを備える。本実施形態において、データ格納部1020は、評価結果格納部1022と、ユーザ指示格納部1024と、文書データ格納部1026と、学習用データセット格納部1028とを有する。
【0137】
本実施形態において、データ格納部1020は、各種のデータを格納する。一実施形態において、データ格納部1020は、解析サーバ140における各種の情報処理に用いられる各種のデータを格納する。他の実施形態において、データ格納部1020は、解析サーバ140における各種の情報処理において生成される各種のデータを格納する。
【0138】
本実施形態において、評価結果格納部1022は、過去に作成された評価結果資料38のデータを格納する。本実施形態において、ユーザ指示格納部1024は、評価結果格納部1022に格納されている評価結果資料38の作成過程において、ユーザ20がユーザ端末120に入力した指示の内容を示すデータ、及び/又は、当該指示に応じて評価支援システム100がユーザ20に提示したデータを格納する。本実施形態において、文書データ格納部1026は、評価結果格納部1022に格納されている評価結果資料38の作成に用いられたプロジェクト資料32のデータを格納する。
【0139】
本実施形態において、学習用データセット格納部1028は、機械学習に用いられるデータセット(学習用データセットと称される場合がある。)を格納する。学習用データセット格納部1028は、学習用データセット生成部1040が生成した学習用データセットを格納してよい。
【0140】
本実施形態において、学習用データセット生成部1040は、関連度推論モデル820の機械学習に用いられる学習用データセットを生成する。学習用データセット生成部1040は、例えば、評価結果資料38に基づいて、上記の学習用データセットを生成する。
【0141】
上述されたとおり、評価結果資料38は、1以上の評価項目のそれぞれについて、各評価項目の内容と、各評価項目に関連する度合いの大きな文字列、文又は文章とが対応付けられている。そのため、例えば、
図6に関連して説明されたテーブルの各レコードは、関連度推論モデル820の機械学習における正例となり得る。
【0142】
一方、
図6に関連して説明されたテーブルの第1レコードに含まれる証跡634は、上記のテーブルの第2レコードに含まれる評価項目624の負例となり得る。第2レコードは、第1レコードとは異なるレコードである。
【0143】
特に、第1レコードに含まれる証跡634のプロジェクト資料32における記載位置と、第2レコードに含まれる証跡634のプロジェクト資料32における記載位置とが比較的近い場合、第1レコードに含まれる証跡634と、第2レコードに含まれる証跡634とが、意味的に類似又は関連している可能性が高い。つまり、評価結果資料38を作成したユーザ20は、意味的に類似又は関連している文字列又は文が、一方の評価項目の証跡としてはふさわしいものの、他方の評価項目の証跡としてはふさわしくないと判断したことになる。このような情報を負例として用いることで、学習済みの学習モデルの推測精度が向上する。
【0144】
そこで、本実施形態によれば、学習用データセット生成部1040は、評価結果資料38において対応付けられている評価項目及び証跡の組み合わせに基づいて正例データを生成する。学習用データセット生成部1040は、例えば、
図6に関連して説明されたテーブルの第1レコードに含まれる評価項目624に関する正例であることを示すラベルと、第1レコードに含まれる評価項目624の内容と、第1レコードに含まれる証跡634の内容とが対応付けられた正例データを生成する。
【0145】
また、学習用データセット生成部1040は、評価結果資料38において対応付けられていない評価項目及び証跡の組み合わせに基づいて負例データ(第1負例データと称される場合がある。)を生成する。学習用データセット生成部1040は、例えば、
図6に関連して説明されたテーブルの第1レコードに含まれる評価項目624に関する負例であることを示すラベルと、第1レコードに含まれる評価項目624の内容と、第2レコードに含まれる証跡634の内容とが対応付けられた負例データを生成する。
【0146】
一実施形態において、学習用データセット生成部1040は、
図6に関連して説明されたテーブルに含まれる複数のレコードのうち、第1レコードとは異なる1以上のレコードの全てを第2レコードとして、上記の負例データを生成する。他の実施形態において、学習用データセット生成部1040は、
図6に関連して説明されたテーブルに含まれる複数のレコードのうち、第1レコードとは異なる1以上のレコードの一部を第2レコードとして、上記の負例データを生成する。
【0147】
この場合において、学習用データセット生成部1040は、第2レコードに含まれる評価項目の評価区分と、第1レコードに含まれる評価項目の評価区分とに基づいて、負例データの生成に用いられる第2レコードを決定してよい。例えば、学習用データセット生成部1040は、第1レコードに含まれる評価項目の評価区分と、第2レコードに含まれる評価項目の評価区分とが同一又は類似するように、上記の第2レコードを決定する。
【0148】
学習用データセット生成部1040は、第2レコードに含まれる証跡634のプロジェクト資料32における記載位置と、第1レコードに含まれる証跡634のプロジェクト資料32における記載位置とに基づいて、負例データの生成に用いられる第2レコードを決定してもよい。上記の記載位置としては、ページ番号、行番号、章番号、節番号、項番号などが例示される。
【0149】
例えば、学習用データセット生成部1040は、第2レコードに含まれる証跡634のプロジェクト資料32における記載位置と、第1レコードに含まれる証跡634のプロジェクト資料32における記載位置とが予め定められた条件を満足するように、負例データの生成に用いられる第2レコードを決定する。上記の予め定められた条件としては、(i)第2レコードに含まれる証跡634が記載されているページ番号と、第1レコードに含まれる証跡634が記載されているページ番号との差の絶対値が予め定められた値以下であるという条件、(ii)第2レコードに含まれる証跡634の記載位置と、第1レコードに含まれる証跡634の記載位置との間の行数が予め定められた値以下であるという条件、(iii)第2レコードに含まれる証跡634が記載されている章番号と、第1レコードに含まれる証跡634が記載されている章番号との差の絶対値が予め定められた値以下であるという条件、(iv)第2レコードに含まれる証跡634が記載されている節番号と、第1レコードに含まれる証跡634が記載されている節番号との差の絶対値が予め定められた値以下であるという条件、(v)第2レコードに含まれる証跡634が記載されている項番号と、第1レコードに含まれる証跡634が記載されている項番号との差の絶対値が予め定められた値以下であるという条件などが例示される。
【0150】
学習用データセット生成部1040は、評価結果資料38に含まれる文又は文字列のうち、特定の評価項目の証跡として対応付けれていない1以上の文又は文字列(他の文又は文字列と称される場合がある。)に基づいて、当該特定の評価項目に関する負例データ(第2負例データと称される場合がある。)を生成してもよい。学習用データセット生成部1040は、特定の評価項目の証跡の記載位置と、他の文又は文字列の記載位置とが、上述された予め定められた条件を満足するように、負例データの生成に用いられる他の文又は文字列を決定してよい。
【0151】
本実施形態において、学習部1060は、機械学習モデルを生成する。学習部1060は、例えば、機械学習により、関連度推論モデル820を生成する。学習部1060は、学習用データセット生成部1040が生成した学習用データセットを教師データとして、関連度推論モデル820を生成する。学習用データセットは、例えば、上述された1以上の正例データと、上述された1以上の負例データとを含む。これにより、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力する関連度推論モデル820が生成される。
【0152】
評価結果格納部1022は、評価結果取得部の一例であってよい。学習用データセット生成部1040は、データ生成装置、評価結果取得部又はデータセット生成部の一例であってよい。学習部1060は、モデル生成装置の一例であってよい。テーブルに含まれる複数のレコードは、複数の項目の一例であってよい。第1レコードは、第1項目の一例であってよい。第2レコードは、第2項目の一例であってよい。
【0153】
図11は、学習用データセット1100の生成処理の一例を概略的に示す。本実施形態においては、学習用データセット生成部1040が、評価結果資料38を用いて学習用データセット1100を生成する処理の一例が説明される。
【0154】
本実施形態において、評価結果資料38は、複数のレコードを含む。複数のレコードのそれぞれは、評価区分622と、評価項目624と、証跡634とを対応付けて格納する。本実施形態において、学習用データセット1100は、複数のレコードを含む。複数のレコードのそれぞれは、評価項目1122と、証跡1124と、ラベル1126とを対応付けて格納する。
【0155】
本実施形態によれば、学習用データセット生成部1040は、例えば、まず、評価結果資料38に含まれる評価項目Xと、当該評価項目Xに対応付けられた証跡xxxと、評価項目Xに対する正例であることを示すラベルとを対応付けて、評価項目Xに対する正例データを作成する。学習用データセット生成部1040は、生成された正例データを学習用データセット1100に追加する。次に、学習用データセット生成部1040は、例えば、評価結果資料38に含まれる評価項目Xと、評価結果資料38において当該評価項目Yに対応付けられた証跡yyyと、評価項目Xに対する負例であることを示すラベルとを対応付けて、評価項目Xに対する負例データを作成する。学習用データセット生成部1040は、生成された負例データを学習用データセット1100に追加する。学習用データセット生成部1040は、同様の処理を繰り返すことで、評価結果資料38を用いて学習用データセット1100を生成することができる。
【0156】
図12は、本発明の複数の態様が全体的又は部分的に具現化されてよいコンピュータ3000の一例を示す。評価支援システム100の少なくとも一部は、コンピュータ3000により実現されてよい。例えば、ユーザ端末120の少なくとも一部が、コンピュータ3000により実現される。制御部130の少なくとも一部が、コンピュータ3000により実現されてよい。例えば、解析サーバ140の少なくとも一部が、コンピュータ3000により実現される。解析部144の少なくとも一部が、コンピュータ3000により実現されてよい。モデル管理部146の少なくとも一部が、コンピュータ3000により実現されてよい。
【0157】
コンピュータ3000にインストールされたプログラムは、コンピュータ3000に、本発明の実施形態に係る装置に関連付けられるオペレーション又は当該装置の1又は複数の「部」として機能させ、又は当該オペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ3000に、本発明の実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ3000に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU3012によって実行されてよい。
【0158】
本実施形態によるコンピュータ3000は、CPU3012、RAM3014、グラフィックコントローラ3016、及びディスプレイデバイス3018を含み、それらはホストコントローラ3010によって相互に接続されている。コンピュータ3000はまた、通信インターフェース3022、ハードディスクドライブ3024、DVD-ROMドライブ3026、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ3020を介してホストコントローラ3010に接続されている。コンピュータはまた、ROM3030及びキーボード3042のようなレガシの入出力ユニットを含み、それらは入出力チップ3040を介して入出力コントローラ3020に接続されている。
【0159】
CPU3012は、ROM3030及びRAM3014内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ3016は、RAM3014内に提供されるフレームバッファ等又はそれ自体の中に、CPU3012によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス3018上に表示されるようにする。
【0160】
通信インターフェース3022は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ3024は、コンピュータ3000内のCPU3012によって使用されるプログラム及びデータを格納する。DVD-ROMドライブ3026は、プログラム又はデータをDVD-ROM3001から読み取り、ハードディスクドライブ3024にRAM3014を介してプログラム又はデータを提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
【0161】
ROM3030はその中に、アクティブ化時にコンピュータ3000によって実行されるブートプログラム等、及び/又はコンピュータ3000のハードウェアに依存するプログラムを格納する。入出力チップ3040はまた、様々な入出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ3020に接続してよい。
【0162】
プログラムが、DVD-ROM3001又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもあるハードディスクドライブ3024、RAM3014、又はROM3030にインストールされ、CPU3012によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ3000に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ3000の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
【0163】
例えば、通信がコンピュータ3000及び外部デバイス間で実行される場合、CPU3012は、RAM3014にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェース3022に対し、通信処理を命令してよい。通信インターフェース3022は、CPU3012の制御の下、RAM3014、ハードディスクドライブ3024、DVD-ROM3001、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
【0164】
また、CPU3012は、ハードディスクドライブ3024、DVD-ROMドライブ3026(DVD-ROM3001)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM3014に読み取られるようにし、RAM3014上のデータに対し様々なタイプの処理を実行してよい。CPU3012は次に、処理されたデータを外部記録媒体にライトバックしてよい。
【0165】
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU3012は、RAM3014から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM3014に対しライトバックする。また、CPU3012は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU3012は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0166】
上で説明したプログラム又はソフトウェアモジュールは、コンピュータ3000上又はコンピュータ3000近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それにより、上記のプログラムを、ネットワークを介してコンピュータ3000に提供する。
【0167】
上記実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び/又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び/又はアナログハードウェア回路を含んでよく、集積回路(IC)及び/又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ(FPGA)、及びプログラマブルロジックアレイ(PLA)等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。
【0168】
コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0169】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。
【0170】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0171】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。また、技術的に矛盾しない範囲において、特定の実施形態について説明した事項を、他の実施形態に適用することができる。また、各構成要素は、名称が同一で、参照符号が異なる他の構成要素と同様の特徴を有してもよい。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0172】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【0173】
本明細書には、例えば、下記の事項が開示されている。
(項目1)
1以上の条件を取得する条件取得部と、
複数の文を含む文書を取得する文書取得部と、
上記文書に含まれる上記複数の文の中から、上記1以上の条件のそれぞれに関連する1以上の文又は文字列を抽出する抽出部と、
を備え、
上記抽出部は、
(a)(i)上記1以上の条件と、(ii)上記複数の文の少なくとも一部を構成する複数の文字列、上記複数の文、又は、上記文書を構成する1以上の構成単位とを、学習済みの機械学習モデルに入力し、
(b)上記機械学習モデルから、上記複数の文字列のそれぞれ、上記複数の文のそれぞれ又は上記1以上の構成単位のそれぞれと、上記1以上の条件のそれぞれとが関連する度合いに関する推論結果に対応する出力を導出する、
情報処理装置。
(項目2)
上記抽出部は、さらに、
(c)上記1以上の条件のそれぞれと、各条件に対応する上記出力により示される文又は文字列とを対応付けて出力する、
項目1に記載の情報処理装置。
(項目3)
上記機械学習モデルは、複数の項目のそれぞれに対する評価者の評価結果を示す情報であって、上記複数の項目のそれぞれの内容と、上記複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報である評価結果情報を含む学習データを用いて機械学習された機械学習モデルであり、
上記複数の項目は、
第1項目と、
上記第1項目とは異なる第2項目と、
を含み、
上記学習データは、
上記第1項目に関する正例であることを示すラベルと、上記第1項目の内容と、上記第1項目に対する評価の根拠とが対応付けられた正例データと、
上記第1項目に関する負例であることを示すラベルと、上記第1項目の内容と、上記第2項目に対する評価の根拠とが対応付けられた第1負例データと、
を含む、
項目1又は項目2に記載の情報処理装置。
(項目4)
上記学習データは、
上記第1項目に関する負例であることを示すラベルと、上記第1項目の内容と、上記第1項目に対する評価の根拠が記載された文書に含まれる1以上の他の文又は文字列とが対応付けられた第2負例データ、
をさらに含む、
項目3に記載の情報処理装置。
(項目5)
上記抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部をさらに備え、
上記画面は、
上記1以上の条件のそれぞれの内容と、上記抽出部が抽出した上記1以上の文又は文字列とを対応付けて提示するための第1オブジェクトと、
上記ユーザから、上記1以上の条件のそれぞれの成否に関する入力を受け付けるための第2オブジェクトと、
を含む、
項目1から項目4までの何れか一項に記載の情報処理装置。
(項目6)
上記抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部をさらに備え、
上記画面は、
上記1以上の条件のそれぞれの内容と、上記抽出部が抽出した上記1以上の文又は文字列とを対応付けて提示するための第1オブジェクトと、
上記ユーザから、上記1以上の条件のそれぞれに関連する文又は文字列の次の候補の提示を要求する次候補要求を受け付けるための第3オブジェクトと、
を含む、
項目1から項目5までの何れか一項に記載の情報処理装置。
(項目7)
上記抽出部の抽出結果をユーザに提示するための画面を生成する画面生成部をさらに備え、
上記画面は、
上記1以上の条件のそれぞれの内容と、上記抽出部が抽出した上記1以上の文又は文字列とを対応付けて提示するための第1オブジェクトと、
上記ユーザから、上記文書における上記1以上の文又は文字列の記載箇所、及び/又は、当該記載箇所の近傍の提示を要求する文書提示要求を受け付けるための第4オブジェクトと、
を含む、
項目1から項目6までの何れか一項に記載の情報処理装置。
(項目8)
上記文書は、特定の企画又は事業が環境及び/又は社会に与える影響を評価するための文書である、
項目1から項目7までの何れか一項に記載の情報処理装置。
(項目9)
複数の項目のそれぞれに対する評価者の評価結果を示す評価結果情報を取得する評価結果取得部と、
上記評価結果情報に基づいてデータセットを生成するデータセット生成部と、
を備え、
上記評価結果情報は、上記複数の項目のそれぞれの内容と、上記複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報であり、
上記複数の項目は、
第1項目と、
上記第1項目とは異なる第2項目と、
を含み、
上記データセットは、
上記第1項目に関する正例であることを示すラベルと、上記第1項目の内容と、上記第1項目に対する評価の根拠とが対応付けられた正例データと、
上記第1項目に関する負例であることを示すラベルと、上記第1項目の内容と、上記第2項目に対する評価の根拠とが対応付けられた第1負例データと、
を含む、
データ生成装置。
(項目10)
項目9に記載のデータ生成装置と、
上記データ生成装置が生成した1以上の上記正例データ及び1以上の上記第1負例データを教師データとして用いて、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力する推論モデルを生成するモデル生成装置と、
を備える、
情報処理システム。
(項目11)
項目1から項目8までの何れか一項に記載の情報処理装置と、
項目9に記載のデータ生成装置と、
上記データ生成装置が生成した1以上の上記正例データ及び1以上の上記第1負例データを教師データとして用いて、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力する推論モデルを生成するモデル生成装置と、
を備える、
情報処理システム。
(項目12)
コンピュータを、項目1から項目8までの何れか一項に記載の情報処理装置として機能させるためのプログラム。
(項目13)
複数の項目のそれぞれに対する評価者の評価結果を示す評価結果情報を取得する評価結果取得段階と、
上記評価結果情報に基づいてデータセットを生成するデータセット生成段階と、
を有し、
上記評価結果情報は、上記複数の項目のそれぞれの内容と、上記複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報であり、
上記複数の項目は、
第1項目と、
上記第1項目とは異なる第2項目と、
を含み、
上記データセットは、
上記第1項目に関する正例であることを示すラベルと、上記第1項目の内容と、上記第1項目に対する評価の根拠とが対応付けられた正例データと、
上記第1項目に関する負例であることを示すラベルと、上記第1項目の内容と、上記第2項目に対する評価の根拠とが対応付けられた第1負例データと、
を含む、
データセットを生産する方法。
(項目14)
複数の項目のそれぞれに対する評価者の評価結果を示す評価結果情報を取得する評価結果取得段階と、
上記評価結果情報に基づいてデータセットを生成するデータセット生成段階と、
上記データセット生成段階において生成された1以上のデータセットを教師データとして用いて推論モデルを生成するモデル生成段階と、
を有し、
上記評価結果情報は、上記複数の項目のそれぞれの内容と、上記複数の項目のそれぞれに対する評価の根拠とが対応付けられた情報であり、
上記複数の項目は、
第1項目と、
上記第1項目とは異なる第2項目と、
を含み、
上記データセットは、
上記第1項目に関する正例であることを示すラベルと、上記第1項目の内容と、上記第1項目に対する評価の根拠とが対応付けられた正例データと、
上記第1項目に関する負例であることを示すラベルと、上記第1項目の内容と、上記第2項目に対する評価の根拠とが対応付けられた第1負例データと、
を含み、
上記モデル生成段階は、1以上の上記正例データ及び1以上の上記第1負例データを教師データとして用いて、(i)特定の条件と、特定の文字列、文又は文章とが関連付けて入力され、(ii)当該特定の条件と、当該特定の文字列、文又は文章とが関連する度合いに関する推論結果を出力する上記推論モデルを生成する、
推論モデルを生産する方法。
【符号の説明】
【0174】
10 通信ネットワーク
20 ユーザ
32 プロジェクト資料
34 評価項目リスト
36 支援画面
38 評価結果資料
100 評価支援システム
120 ユーザ端末
122 通信部
124 入力部
126 出力部
128 格納部
130 制御部
140 解析サーバ
142 モデル格納部
144 解析部
146 モデル管理部
148 学習用データ収集部
220 章
230 節
242 文
244 文字列
252 表
254 図面
260 項
322 評価項目ID
324 評価区分
326 評価項目
420 提示領域
422 評価区分
424 評価項目
426 証跡
428 所在
440 入力領域
442 評価結果
444 操作
452 オブジェクト
454 オブジェクト
456 オブジェクト
500 文書表示画面
520 文書表示領域
522 ブロック
524 ブロック
530 マーカ
540 評価項目表示領域
542 評価項目
560 スクロールバー
622 評価区分
624 評価項目
632 評価結果
634 証跡
636 所在
722 解析対象特定部
724 評価項目特定部
726 解析要求出力部
728 解析結果取得部
740 評価結果生成部
742 支援画面生成部
744 ユーザ指示取得部
746 ユーザ指示応答部
748 学習用データ取得部
820 関連度推論モデル
842 入力データ生成部
844 出力データ取得部
846 解析結果出力部
922 解析対象取得部
924 テキストデータ生成部
926 テキストデータ分割部
932 評価項目取得部
940 入力用データセット生成部
1020 データ格納部
1022 評価結果格納部
1024 ユーザ指示格納部
1026 文書データ格納部
1028 学習用データセット格納部
1040 学習用データセット生成部
1060 学習部
1100 学習用データセット
1122 評価項目
1124 証跡
1126 ラベル
3000 コンピュータ
3001 DVD-ROM
3010 ホストコントローラ
3012 CPU
3014 RAM
3016 グラフィックコントローラ
3018 ディスプレイデバイス
3020 入出力コントローラ
3022 通信インターフェース
3024 ハードディスクドライブ
3026 DVD-ROMドライブ
3030 ROM
3040 入出力チップ
3042 キーボード