IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社エスプールブルードットグリーンの特許一覧

<>
  • 特許-情報処理装置及び情報処理方法 図1
  • 特許-情報処理装置及び情報処理方法 図2
  • 特許-情報処理装置及び情報処理方法 図3
  • 特許-情報処理装置及び情報処理方法 図4
  • 特許-情報処理装置及び情報処理方法 図5
  • 特許-情報処理装置及び情報処理方法 図6
  • 特許-情報処理装置及び情報処理方法 図7
  • 特許-情報処理装置及び情報処理方法 図8
  • 特許-情報処理装置及び情報処理方法 図9
  • 特許-情報処理装置及び情報処理方法 図10
  • 特許-情報処理装置及び情報処理方法 図11
  • 特許-情報処理装置及び情報処理方法 図12
  • 特許-情報処理装置及び情報処理方法 図13
  • 特許-情報処理装置及び情報処理方法 図14
  • 特許-情報処理装置及び情報処理方法 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-01-31
(45)【発行日】2025-02-10
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20250203BHJP
【FI】
G06Q50/10
【請求項の数】 11
(21)【出願番号】P 2024172817
(22)【出願日】2024-10-01
【審査請求日】2024-10-01
【早期審査対象出願】
(73)【特許権者】
【識別番号】521492089
【氏名又は名称】株式会社エスプールブルードットグリーン
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100103263
【弁理士】
【氏名又は名称】川崎 康
(72)【発明者】
【氏名】三須 侑汰
(72)【発明者】
【氏名】川島 大地
(72)【発明者】
【氏名】冨田 直行
(72)【発明者】
【氏名】ファン ティ ティエット リン
【審査官】池田 聡史
(56)【参考文献】
【文献】特開2024-080602(JP,A)
【文献】特開2024-017422(JP,A)
【文献】特開2023-107760(JP,A)
【文献】特開2023-027741(JP,A)
【文献】特開2023-027740(JP,A)
【文献】特開2023-121111(JP,A)
【文献】特表2024-518044(JP,A)
【文献】特開2023-168121(JP,A)
【文献】特開2022-054002(JP,A)
【文献】米国特許出願公開第2023/0289911(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
複数の会計データのそれぞれを、大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類する分類部と、
前記分類部で分類された前記分類項目を、機械学習モデルの入力データに変換するデータ変換部と、
前記入力データを学習済みの前記機械学習モデルに入力して、前記機械学習モデルで推論された温室効果ガスの排出係数に紐づけられる排出関連情報を取得する推論部と、
グローバルサプライチェーンでの温室効果ガスの排出係数と前記排出関連情報との対応関係をそれぞれ含む複数のマスタデータの中から、前記推論部で取得された前記排出関連情報を含むマスタデータを選択するマスタ選択部と、
前記マスタ選択部で選択された前記マスタデータから、前記推論部で取得された前記排出関連情報に対応する排出係数を検索する検索部と、
前記検索部で検索された前記排出係数に基づいて、前記温室効果ガスの排出量を算出する算出部と、を備える、
情報処理装置。
【請求項2】
前記複数のマスタデータは、国立環境研究所、環境省、東京都環境局、及び産業技術総合研究所の少なくとも一つが提供する前記排出係数を含むデータベースに基づいて生成される、
請求項1に記載の情報処理装置。
【請求項3】
前記複数の会計データのそれぞれについて、前記分類項目と、前記マスタ選択部で選択された前記マスタデータの情報と、前記検索部で検索された前記排出係数とを含む排出係数付加データを生成する付加情報生成部を備える、
請求項1に記載の情報処理装置。
【請求項4】
前記分類項目に含まれる前記摘要は、前記中分類の会計科目をより具体的に表す会計科目であり、
前記分類項目に含まれる中分類は、前記大分類をより具体的に表す会計科目である、
請求項1に記載の情報処理装置。
【請求項5】
前記データ変換部は、前記分類部で分類された各分類項目に含まれるテキスト情報のリスト化及び品詞解析を順に行って、前記テキスト情報を複数のトークンに変換し、前記複数のトークンのそれぞれの識別情報を要素とするベクトルに基づいて前記入力データを生成する、
請求項1に記載の情報処理装置。
【請求項6】
前記データ変換部は、前記品詞解析を行う際には、リスト化されたテキスト情報に対して形態素解析を行った後に、品詞分解を行う、
請求項5に記載の情報処理装置。
【請求項7】
前記データ変換部は、前記品詞解析を行った後に、前記トークンに変換するのに不必要なワードを前記テキスト情報から除去する、
請求項5に記載の情報処理装置。
【請求項8】
前記複数の会計データのそれぞれは、対応する前記分類項目の金額又は物量を表す活動量を含み、
前記算出部は、前記複数の会計データのそれぞれごとに、前記検索部で検索された前記排出係数に、対応する前記活動量を乗じることにより、前記排出量を算出する、
請求項1に記載の情報処理装置。
【請求項9】
前記機械学習モデルは、BERT (Bidirectional Encoder Representations from Transformers)モデルから派生した深層学習モデルである、
請求項1に記載の情報処理装置。
【請求項10】
前記複数のマスタデータは、サプライチェーンでのScope1、Scope2、及びScope3における排出係数を含む、
請求項1乃至9のいずれか一項に記載の情報処理装置。
【請求項11】
コンピュータは、
複数の会計データのそれぞれを、大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類するステップと、
前記分類された前記分類項目を、機械学習モデルの入力データに変換するステップと、
前記入力データを学習済みの前記機械学習モデルに入力して、前記機械学習モデルで推論された温室効果ガスの排出係数に紐づけられる排出関連情報を取得するステップと、
グローバルサプライチェーンでの温室効果ガスの排出係数と前記排出関連情報との対応関係をそれぞれ含む複数のマスタデータの中から、前記取得された前記排出関連情報を含むマスタデータを選択するステップと、
前記選択された前記マスタデータから、前記取得された前記排出関連情報に対応する排出係数を検索するステップと、
前記検索された前記排出係数に基づいて、前記温室効果ガスの排出量を算出するステップと、を実行する
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
二酸化炭素等の温室効果ガス(GHG:Greenhouse Gas)の削減に対する取り組みが加速する中、多くの事業者が環境に配慮した経営を行うことが求められている。製品だけでなく、事業者のサプライチェーン上の活動に伴う温室効果ガスの排出量を算定対象とすることは、事業者の活動全体を管理する上で重要である。温室効果ガスの排出量を算出するには、個々の活動量ごとの排出係数を把握する必要がある。排出係数は、排出原単位とも呼ばれる。
【0003】
活動内容と、活動内容の活動量を示す活動情報と、温室効果ガスの排出量を算定する範囲である複数のスコープ及びカテゴリの割合を特定するための割合特定情報とに基づいて、複数のスコープ及びカテゴリのそれぞれごとに温室効果ガスの排出量を導出する技術が開示されている(特許文献1参照)。
【0004】
また、既存の排出原単位フォーマットの中から、ユーザの業種と活動量データの作成元のアプリケーション種別を考慮して、新たな活動量データに対して最適な排出原単位フォーマットを選択する技術が開示されている(特許文献2参照)。
【先行技術文献】
【特許文献】
【0005】
【文献】特許第7369984号公報
【文献】特許第7132580号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1の場合、活動内容と活動量を複数のスコープ及びカテゴリに割り当てる割合を特定する作業に手間がかかり、また、特定した割合が正しい保証がないことから、温室効果ガスの排出量を精度よく予測できないおそれがある。
また、特許文献2の場合、既存の排出原単位フォーマットをユーザ自身で作成する必要があり、ユーザの手間が大きい。また、ユーザの入力ミス等により、不適切な排出原単位フォーマットが作成されるおそれがあり、排出係数(排出原)を正しく算出できる保証がない。
【0007】
そこで、本開示では、ユーザの手間を煩わせることなく、温室効果ガスの排出係数及び排出量を精度よく算出できる情報処理装置及び情報処理方法を提供するものである。
【課題を解決するための手段】
【0008】
上記の課題を解決するために、本開示によれば、複数の会計データのそれぞれを、大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類する分類部と、
前記分類部で分類された前記分類項目を、機械学習モデルの入力データに変換するデータ変換部と、
前記入力データを学習済みの前記機械学習モデルに入力して、前記機械学習モデルで推論された温室効果ガスの排出関連情報を取得する推論部と、
グローバルサプライチェーンでの温室効果ガスの排出係数をそれぞれ含む複数のマスタデータの中から、前記推論部で取得された前記排出関連情報に対応するマスタデータを選択するマスタ選択部と、
前記マスタ選択部で選択された前記マスタデータから、前記推論部で取得された前記排出関連情報に対応する排出係数を検索する検索部と、
前記検索部で検索された前記排出係数に基づいて、前記温室効果ガスの排出量を算出する算出部と、を備える、情報処理装置が提供される。
【図面の簡単な説明】
【0009】
図1】一実施形態に係る情報処理装置の概略構成を示すブロック図。
図2】サプライチェーンでの温室効果ガスを説明する図。
図3】第1マスタデータのデータ構成を示す図。
図4】第2マスタデータのデータ構成を示す図。
図5】第3マスタデータのデータ構成を示す図。
図6】第4マスタデータのデータ構成を示す図。
図7】第5マスタデータのデータ構成を示す図。
図8】第6マスタデータのデータ構成を示す図。
図9】第7マスタデータのデータ構成を示す図。
図10】一実施形態に係る情報処理装置の処理動作を示すフローチャート。
図11】リスト化の一例を示す図。
図12】品詞解析の一例を示す図。
図13】ストップワードの一例を示す図。
図14図10のステップS6とS7の処理動作の詳細を示すフローチャート。
図15図10のステップS11で生成される排出係数付加データの一例を示す図。
【発明を実施するための形態】
【0010】
以下、図面を参照して、情報処理装置及び情報処理方法の実施形態について説明する。以下では、情報処理装置の主要な構成部分を中心に説明するが、情報処理装置には、図示又は説明されていない構成部分や機能が存在しうる。以下の説明は、図示又は説明されていない構成部分や機能を除外するものではない。
【0011】
図1は一実施形態に係る情報処理装置1の概略構成を示すブロック図である。一実施形態に係る情報処理装置1の処理は、例えば、コンピュータにより実行される。この場合、図1に示すブロック図は、コンピュータによって実行される処理の機能ブロック図である。あるいは、一実施形態に係る情報処理装置1は、半導体チップ又はディスクリート回路で構成することも可能である。この場合、図1に示す各ブロックは、半導体チップ又はディスクリート回路に内蔵されるハードウェア回路で構成される。
【0012】
図1に示すように、一実施形態に係る情報処理装置1は、分類部2と、データ変換部3と、推論部4と、マスタ選択部5と、検索部6と、算出部7とを備える。
【0013】
分類部2は、複数の会計データのそれぞれを、大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類する。分類項目とは、会計データの特徴を表す項目である。会計データとは、事業者の活動によるお金の流れに関連するデータである。会計データは、例えば、年度、日付、事業者名、集計単位、活動内容、活動量、単位などの情報を含む。活動量は、例えば、金額又は物量を含む。単位は活動量の単位である。
【0014】
分類部2が会計データを分類項目に分類する処理は、作業者が手動で行う処理でもよいし、コンピュータ等を用いた自動化処理でもよい。分類項目に含まれる摘要は、中分類の会計科目をより具体的に表す会計科目である。中分類は、大分類の会計科目をより具体的に表す会計科目である。すなわち、摘要の会計科目は中分類の会計科目に包含され、中分類の会計科目は大分類の会計科目に包含される。
【0015】
会計データが大分類、中分類及び摘要の3つを含む分類項目に分類される場合と、大分類、中分類又は摘要のいずれか一つ以上を含まない分類項目に分類される場合とがありうる。また、会計データによっては、大分類、中分類及び摘要以外の分類項目に分類される場合がありうる。
【0016】
データ変換部3は、分類部2で分類された分類項目を、機械学習モデルの入力データに変換する。機械学習モデルは、例えば、BERT (Bidirectional Encoder Representations from Transformers)モデルから派生した深層学習モデルであり、日本語の自然言語処理に特化したモデルである。データ変換部3の詳細な処理動作は、後述する。
【0017】
推論部4は、データ変換部3で変換された入力データを学習済みの機械学習モデルに入力して、機械学習モデルにて推論を行い、機械学習モデルから出力された推論結果である温室効果ガスの排出関連情報を取得する。本明細書では、排出関連情報を紐づけ内容と呼ぶことがある。後述するように、紐づけ内容は、マスタデータにおける排出係数に紐づけられる。
【0018】
マスタ選択部5は、グローバルサプライチェーンでの温室効果ガスの排出係数をそれぞれ含む複数のマスタデータの中から、推論部4で取得された排出関連情報(紐づけ内容)に対応するマスタデータを選択する。各マスタデータは、排出関連情報(紐づけ内容)と排出係数との対応関係を含むデータである。複数のマスタデータは、例えば、国立環境研究所、環境省、東京都環境局、又は産業技術総合研究所が提供する排出係数を含む種々のデータベースに基づいて生成される。マスタデータの具体的内容については、後述する。
【0019】
検索部6は、マスタ選択部5で選択されたマスタデータから、推論部4で取得された排出関連情報(紐づけ内容)に対応する排出係数を検索する。
【0020】
算出部7は、検索部6で検索された排出係数に基づいて、温室効果ガスの排出量を算出する。より具体的には、算出部7は、複数の会計データのそれぞれごとに、検索部6で検索された排出係数に、対応する活動量を乗じることにより、排出量を算出する。
【0021】
一実施形態に係る情報処理装置1は、図1に示すように、付加情報生成部8を備えてもよい。付加情報生成部8は、複数の会計データのそれぞれについて、分類項目と、マスタ選択部5で選択されたマスタデータの情報と、検索部6で検索された排出係数とを含む排出係数付加データを生成する。排出係数付加データの具体例は後述する。
【0022】
図2はサプライチェーンでの温室効果ガスを説明する図である。サプライチェーンとは、原料調達、製造、物流、販売、廃棄などの事業者が行う一連の活動を指す。サプライチェーンで発生される温室効果ガスの排出量を、本明細書ではサプライチェーン排出量と呼ぶ。
【0023】
サプライチェーン排出量は、Scope1、Scope2、及びScope3に分類される。サプライチェーンの上流と下流における温室効果ガスの排出はScope3であり、事業者自身による温室効果ガスの排出はScope1とScope2である。
【0024】
Scope1は、事業者自らによる温室効果ガスの直接的な排出である。Scope2は、他社から供給された電気、熱、蒸気の使用に伴う温室効果ガスの間接的な排出である。Scope3は、Scope1とScope2以外の温室効果ガスの間接的な排出であり、事業者の活動に関連する他の事業者による温室効果ガスの排出である。
【0025】
Scope3は、15個のカテゴリと、任意の数のその他のカテゴリに分類される。その他のカテゴリは、環境省と経済産業省の基本ガイドライン独自のカテゴリである。15個のカテゴリは、GHGプロトコルのScope3基準と整合する。なお、対象となる温室効果ガスは、二酸化炭素(CO)、メタン(CH)、一酸化ニ窒素(NO)、ハイドロフルオロカーボン類(HFCs)、パーフルオロカーボン類(PFCs)、六フッ化硫黄(SF)、及び三フッ化窒素(NF)である。本明細書では、これらの温室効果ガスのCO換算量を"CO"と表記し、"CO換算後排出量"を"排出量"と呼ぶ。
【0026】
サプライチェーンの上流のScope3は、カテゴリ1~8を含む。カテゴリ1は、原材料、部品、容器、及び包装等が製造されるまでの活動に伴う排出である。カテゴリ2は、事業者(自社)の資本財の建設又は製造に伴う排出である。カテゴリ3は、調達している燃料の上流工程(採掘又は精製等)に伴う排出と、調達している電力等の上流工程(発電に使用する燃料の採掘又は精製等)に伴う排出である。カテゴリ4は、(1)報告対象年度に購入した製品とサービスのサプライヤから事業者(自社)への物流(輸送、荷役、保管)に伴う排出と、(2)報告対象年度に購入した(1)以外の物流サービス(輸送、荷役、保管)に伴う排出(事業者が費用負担している物流に伴う排出)である。カテゴリ5は、事業者(自社)で発生した廃棄物の輸送処理に伴う排出である。カテゴリ6は、従業員の出張に伴う排出である。カテゴリ7は、従業員が通勤する際の移動に伴う排出である。カテゴリ8は、事業者(自社)が賃借しているリース資産の操業に伴う排出(Scope1とScope2で算定する場合を除く)である。
【0027】
サプライチェーンの下流のScope3は、カテゴリ9~15を含む。カテゴリ9は、事業者(自社)が販売した製品の最終消費者までの物流(輸送、荷役、保管、販売)に伴う排出(事業者が費用負担していないものに限る)である。カテゴリ10は、事業者による中間製品の加工に伴う排出である。カテゴリ11は、使用者(消費者、事業者)による製品の使用に伴う排出である。カテゴリ12は、使用者(消費者、事業者)による製品の廃棄時の処理に伴う排出である。カテゴリ13は、事業者(自社)が賃貸事業者として所有し、他者に賃貸しているリース資産の適用に伴う排出である。カテゴリ14は、フランチャイズ加盟者における排出である。カテゴリ15は、投資の運用に伴う排出である。
【0028】
Scope1、Scope2、及びScope3に分類されるサプライチェーン排出量は、複数のマスタデータに分けて登録されている。複数のマスタデータは、国又は団体が公開している排出原単位(排出係数)をまとめたデータベースに基づいて生成されるデータである。複数のマスタデータは、例えば、7つのマスタデータを含む。本明細書では、7つのマスタデータを第1~第7マスタデータと呼ぶ。図3図9は第1~第7マスタデータのデータ構成を示す図である。
【0029】
図3に示す第1マスタデータは、独立行政法人 国立環境研究所が提供するGLIO (Global Link Input-Output)モデルを用いて推定された排出原単位データベースである。図3は、第1マスタデータの抜粋である。第1マスタデータは、行ID、行コード、部門名、単位、GLIO1~GLIO5の項目を有する。部門名は、例えば事業者が購入する具体的な製品名又はサービス名を指す。部門名は、排出関連情報(紐づけ内容)に対応する。GLIO1は、購入する製品又はサービスの送料込みの価格であり、卸小売りなしの生産者の販売価格である。GLIO2は、送料込みの価格であり、卸小売りありの購入者の購入価格である。GLIO3は、送料なしで、卸売りなしの生産者の販売価格である。GLIO4は、環境省のDB[5]に準拠した送料なしで卸小売りありの購入者の購入価格である。GLIO5は、環境省のDB[5]に準拠した生産者の販売価格である。本実施形態では、GLIO2→GLIO4→GLIO5の優先順位で排出係数を決定する。
【0030】
図4に示す第2マスタデータは、環境省が提供する排出原単位データベースから、Scope3のカテゴリ4、6、7の排出係数を抽出したデータである。図4は第2マスタデータの抜粋である。図4に示すように、第2マスタデータは、紐づけ内容、排出係数_単位、及び排出係数の項目を有する。第2マスタデータは、ソースの列に記載されているように、他の複数のマスタデータの一部を抽出して生成される。
【0031】
図5に示す第3マスタデータは、環境省が提供する電気事業者別の排出係数を含むデータである。図5に示すように、第3マスタデータは、会計年度、排出係数、単位、及び出所の項目を有する。
【0032】
図6に示す第4マスタデータは、環境省が提供する算定、報告、及び公表制度(SHK制度)の排出係数を含むデータである。図6は、第4マスタデータの抜粋である。図6に示すように、第4マスタデータは、会計年度、データベースのバージョン、シート、紐づけ内容2、紐づけ内容、排出係数、単位、及び出所の項目を有する。
【0033】
図7に示す第5マスタデータは、東京都環境局が提供する地球温暖化対策報告書制度における係数一覧のデータである。図7に示すように、第5マスタデータは、会計年度、紐づけ内容、排出係数、単位、及び出所の項目を有する。
【0034】
図8に示す第6マスタデータは、産業技術総合研究所が提供するインベントリデータベースIDEAv3.1の係数に基づいて資源エネルギ庁が発行するエネルギ種別の単位発熱量と、エネルギ種別単価に基づいて算出された単位価格当たりの排出係数を含むデータである。第6マスタデータは、燃料排出係数のデータである。図8に示すように、第6マスタデータは、年度、燃料名、IDEA製品コード、燃焼エネルギ_排出係数、燃焼エネルギ_単位、単位発熱量_高位、単位発熱量_単位、燃料_平均単価、燃料_単位、使用量用_排出係数、使用量用_単位、金額用排出係数_t-co2eq/百万円、及びデータソース_排出係数の項目を有する。このうち、燃料名が紐づけ内容に対応する。
【0035】
図9に示す第7マスタデータは、上述したインベントリデータベースIDEAv3.1の抜粋である。図9に示すように、第7マスタデータは、上水道、セメント、一般製材についての種々の項目の排出係数を含む。上水道、セメント、一般製材が紐づけ内容である。
【0036】
上述したように、第1~第7マスタデータはいずれも、排出関連情報(紐づけ内容)と排出係数を含んでいる。なお、本実施形態における複数のマスタデータは、必ずしも上述した第1~第7マスタデータのすべてを備える必要はなく、第1~第7マスタデータ以外のデータをマスタデータとしてもよいが、排出関連情報(紐づけ内容)と排出係数は含んでいる必要がある。
【0037】
マスタ選択部5は、推論部4で取得された排出関連情報(紐づけ内容)を含むマスタデータを選択する。例えば、マスタ選択部5は、紐づけ内容が「広告」、「事務用品」、「物品賃貸業(除貸自動車)」、「移動電気通信」、「ボルト・ナット・スプリング」、「石油製品」、「配管工事付属品・粉末や金製品・道具類」、又は「建築用金属製品」であれば、第1マスタデータ(GLIO)を選択する。また、マスタ選択部5は、例えば、紐づけ内容が「カテゴリ4_道路貨物輸送(除自家輸送)」、「カテゴリ5_廃棄物処理(公営)★★」、「カテゴリ5_下水道★★」、「カテゴリ6_旅客鉄道」、又は「カテゴリ7_旅客鉄道」であれば第2マスタデータ(カテゴリ4~6他)を選択する。また、マスタ選択部5は、例えば、紐づけ内容が「Scope2_電気」であれば第3マスタデータ(電気事業者別)を選択する。また、マスタ選択部5は、例えば、紐づけ内容が「Scope2_冷水」であれば第4マスタデータ(SHK制度)を選択する。また、マスタ選択部5は、例えば、紐づけ内容が「Scope1_LPG」であれば第6マスタデータ(燃料排出係数)を選択する。また、マスタ選択部5は、例えば、紐づけ内容が「上水道(単位m3)」、「セメント、4桁」、又は「一般製材、4桁」であれば、第7マスタデータ(IDEAv3.1)を選択する。
【0038】
図10は一実施形態に係る情報処理装置1の処理動作を示すフローチャートである。まず、事業者の会計データを入力する(ステップS1)。複数の会計データを含むファイルを入力してもよいし、個々の会計データを個別に入力してもよい。
【0039】
次に、分類部2にて、入力された会計データを大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類する(ステップS2)。例えば、大分類は、水道光熱費、雑費、通勤交通費、出張交通費、事務用品費、雑費、通信運搬費、〇〇工場などを含む。中分類は、例えば、光熱費、通勤費、出張費用、〇〇部〇×課などを含む。摘要は、例えば、「〇〇事業所 ガス代」、「×〇事業所 電気代金」、「〇△事業所 水道料」などを含む。
【0040】
次に、データ変換部3にて、分類部2で分類された分類項目をリスト化する(ステップS3)。図11はリスト化の一例を示す図である。リスト化では、大分類、中分類、及び摘要の各テキスト情報を連結して一つのテキスト情報を生成する。図11の例では、大分類が「水道光熱費」、中分類が「光熱費」、摘要が「〇〇事業所 ガス代」である。この場合、リスト化により、「水道光熱費,光熱費,〇〇事業所 ガス代」という一つのテキスト情報が生成される。図11に示すように、リスト化では、各テキスト情報をカンマで区切って、複数のテキスト情報を繋げた一つのテキスト情報が生成される。
【0041】
次に、データ変換部3にて、リスト化された一つのテキスト情報の品詞解析を行う(図10のステップS4)。図12は品詞解析の一例を示す図である。品詞解析では、テキスト情報の形態素解析を行った後に、品詞分解を行う。図12の例では、「水道光熱費,光熱費,〇〇事業所 ガス代」というテキスト情報に対して形態素解析を行って、「水道,光熱,費,〇〇,事業所,ガス,代」というテキスト情報が生成される。形態素解析により分割されたテキスト情報は、サブワードと呼ばれる。
【0042】
続いて、品詞分解を行って、「水道/名詞,光熱/名詞,費/名詞,〇〇/名詞,事業所/名詞,ガス/名詞,代/名詞」という品詞を含むテキスト情報に分解される。図12の例では品詞がすべて名詞であるが、テキスト情報によっては、「動詞」、「助詞」、「助動詞」、「記号」などの品詞に分解される場合がある。
【0043】
次に、データ変換部3にて、ストップワードの除外を行う(図10のステップS5)。図13はストップワードの一例を示す図である。読点で区切られた文字又は文字列がストップワードである。ストップワードは、自然言語処理を行う上で必要でない文字又は文字列である。ステップS4で品詞解析を行ったテキスト情報に含まれるストップワードが除外される。
【0044】
次に、データ変換部3にて、テキスト情報のトークン化を行う(図10のステップS6)。ステップS6では、形態素解析を行った単語をトークンに分割して、トークンIDを割り振る。トークンIDは、各トークンを識別する識別情報である。
【0045】
次に、データ変換部3にて、ベクトル化を行う(図10のステップS7)。ステップS7では、各トークンのIDを要素とするベクトルを生成する。ベクトル化によって、深層学習モデルに入力される入力データが生成される。
【0046】
次に、推論部4にて、ステップS7で生成された入力データを学習済みの深層学習モデルに入力して推論を行い、深層学習モデルから出力された排出関連情報である紐づけ内容を取得する(図10のステップS8)。
【0047】
次に、マスタ選択部5にて、第1~第7マスタデータから、ステップS8で取得された紐づけ内容に対応するマスタデータを選択する(図10のステップS9)。
【0048】
次に、検索部6にて、マスタ選択部5で選択されたマスタデータから、紐づけ内容に対応する排出係数を検索する(図10のステップS10)。
【0049】
次に、付加情報生成部8にて、分類項目と、マスタ選択部5で選択されたマスタデータの情報と、検索部6で検索された排出係数とを含む排出係数付加データを生成する(図10のステップS11)。
【0050】
次に、算出部7にて単位を変換する(図10のステップS12)。ここでは、例えば、単位をtCO2/百万円に揃える。
【0051】
次に、排出係数付加データに含まれる入力値に排出係数を乗じてCO排出量を算定する(図10のステップS13)。入力値は、対応する分類項目の金額又は物量を表す活動量を表す。
【0052】
図14図10のステップS6とS7の処理動作の詳細を示すフローチャートである。まず、形態素解析により単語に分割された入力データを、単語よりも小さい単位であるサブワードに分割する(ステップS21)。ステップS21の処理には、例えばWordPieceが用いられる。個々のサブワードはトークンと呼ばれる。
【0053】
次に、トークンの先頭と末尾に特殊なトークンを挿入する(ステップS22)。トークンの先頭と末尾に挿入される特殊なトークンはそれぞれ、CLS、SEPと呼ばれる。
【0054】
次に、複数のトークンのそれぞれをID(以下、トークンIDと呼ぶ)に変換して、複数のトークンをまとめて処理するためのバッチ処理の長さを揃えるためにパディングを生成する(ステップS23)。複数のトークンIDとパディングによりベクトルが生成される。
【0055】
次に、ベクトルに含まれる複数のトークンIDとパディングを区別するためのアテンションマスクを生成する(ステップS24)。複数のトークンIDとアテンションマスクを含むベクトル化された入力データを機械学習モデルに入力する(ステップS25)。
【0056】
図15図10のステップS11で生成される排出係数付加データの一例を示す図である。図15の排出係数付加データは、年度、会社名、集計単位、大分類、中分類、摘要、入力値、単位、紐づけ内容、排出係数、及び排出係数単位の項目を含む。図15の排出係数付加データに含まれる年度、会社名、集計単位、入力値、及び単位は、図10のステップS1で入力される会計データである。図15の大分類、中分類、及び摘要は、図10のステップS2で会計データを分類した分類項目である。
【0057】
排出係数付加データの各行は、それぞれ異なる会計データである。各行の入力値に排出係数を乗じることで、COの排出量を算出できる。
【0058】
このように、本実施形態では、会計データを大分類、中分類、及び摘要からなる分類項目に分類し、分類項目に合致するマスタデータを選択して、選択したマスタデータから分類項目に対応する紐づけ内容と排出係数を選択し、選択した排出係数から温室効果ガスの排出量を算出する。また、会計データと、分類項目と、選択した紐づけ内容及び排出係数とを含む排出係数付加データを生成する。これにより、会計データに対応する温室効果ガスの排出量を簡易かつ正確に算出できる。
【0059】
上述した実施形態で説明した情報処理装置の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理装置の少なくとも一部の機能を実現するプログラムをフレキシブルディスクや光ディスク等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0060】
また、情報処理装置の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0061】
本発明の態様は、上述した個々の実施形態に限定されるものではなく、当業者が想到しうる種々の変形も含むものであり、本発明の効果も上述した内容に限定されない。すなわち、特許請求の範囲に規定された内容およびその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更および部分的削除が可能である。
【0062】
[付記]
[項目1]
複数の会計データのそれぞれを、大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類する分類部と、
前記分類部で分類された前記分類項目を、機械学習モデルの入力データに変換するデータ変換部と、
前記入力データを学習済みの前記機械学習モデルに入力して、前記機械学習モデルで推論された温室効果ガスの排出関連情報を取得する推論部と、
グローバルサプライチェーンでの温室効果ガスの排出係数をそれぞれ含む複数のマスタデータの中から、前記推論部で取得された前記排出関連情報に対応するマスタデータを選択するマスタ選択部と、
前記マスタ選択部で選択された前記マスタデータから、前記推論部で取得された前記排出関連情報に対応する排出係数を検索する検索部と、
前記検索部で検索された前記排出係数に基づいて、前記温室効果ガスの排出量を算出する算出部と、を備える、
情報処理装置。
[項目2]
前記複数のマスタデータは、国立環境研究所、環境省、東京都環境局、及び産業技術総合研究所の少なくとも一つが提供する前記排出係数を含むデータベースに基づいて生成される、
項目1に記載の情報処理装置。
[項目3]
前記複数の会計データのそれぞれについて、前記分類項目と、前記マスタ選択部で選択された前記マスタデータの情報と、前記検索部で検索された前記排出係数とを含む排出係数付加データを生成する付加情報生成部を備える、
項目1又は2に記載の情報処理装置。
[項目4]
前記分類項目に含まれる前記摘要は、前記中分類の会計科目をより具体的に表す会計科目であり、
前記分類項目に含まれる中分類は、前記大分類をより具体的に表す会計科目である、
項目1乃至3のいずれか一項に記載の情報処理装置。
[項目5]
前記データ変換部は、前記分類部で分類された各分類項目に含まれるテキスト情報のリスト化及び品詞解析を順に行って、前記テキスト情報を複数のトークンに変換し、前記複数のトークンのそれぞれの識別情報を要素とするベクトルに基づいて前記入力データを生成する、
項目1乃至4のいずれか一項に記載の情報処理装置。
[項目6]
前記データ変換部は、前記品詞解析を行う際には、リスト化されたテキスト情報に対して形態素解析を行った後に、品詞分解を行う、
項目5に記載の情報処理装置。
[項目7]
前記データ変換部は、前記品詞解析を行った後に、前記トークンに変換するのに不必要なワードを前記テキスト情報から除去する、
項目5又は6に記載の情報処理装置。
[項目8]
前記複数の会計データのそれぞれは、対応する前記分類項目の金額又は物量を表す活動量を含み、
前記算出部は、前記複数の会計データのそれぞれごとに、前記検索部で検索された前記排出係数に、対応する前記活動量を乗じることにより、前記排出量を算出する、
項目1乃至7のいずれか一項に記載の情報処理装置。
[項目9]
前記機械学習モデルは、BERT (Bidirectional Encoder Representations from Transformers)モデルから派生した深層学習モデルである、
項目1乃至8のいずれか一項に記載の情報処理装置。
[項目10]
前記複数のマスタデータは、サプライチェーンでのScope1、Scope2、及びScope3における排出係数を含む、
項目1乃至9のいずれか一項に記載の情報処理装置。
[項目11]
コンピュータは、
複数の会計データのそれぞれを、大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類するステップと、
前記分類された前記分類項目を、機械学習モデルの入力データに変換するステップと、
前記入力データを学習済みの前記機械学習モデルに入力して、前記機械学習モデルで推論された温室効果ガスの排出関連情報を取得するステップと、
グローバルサプライチェーンでの温室効果ガスの排出係数をそれぞれ含む複数のマスタデータの中から、前記取得された前記排出関連情報に対応するマスタデータを選択するステップと、
前記選択された前記マスタデータから、前記取得された前記排出関連情報に対応する排出係数を検索するステップと、
前記検索された前記排出係数に基づいて、前記温室効果ガスの排出量を算出するステップと、を備える、
情報処理方法。
【0063】
本開示の態様は、上述した個々の実施形態に限定されるものではなく、当業者が想到しうる種々の変形も含むものであり、本開示の効果も上述した内容に限定されない。すなわち、特許請求の範囲に規定された内容およびその均等物から導き出される本開示の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更および部分的削除が可能である。
【符号の説明】
【0064】
1 情報処理装置、2 分類部、3 データ変換部、4 推論部、5 マスタ選択部、6 検索部、7 算出部、8 付加情報生成部
【要約】

【課題】 ユーザの手間を煩わせることなく、温室効果ガスの排出係数及び排出量を精度よく算出する。
【解決手段】 情報処理装置は、複数の会計データのそれぞれを、大分類、中分類、又は摘要の少なくとも一つを含む分類項目に分類する分類部と、分類された分類項目を、機械学習モデルの入力データに変換するデータ変換部と、入力データを学習済みの機械学習モデルに入力して、機械学習モデルで推論された温室効果ガスの排出関連情報を取得する推論部と、グローバルサプライチェーンでの温室効果ガスの排出係数をそれぞれ含む複数のマスタデータの中から、推論部で取得された排出関連情報に対応するマスタデータを選択するマスタ選択部と、マスタ選択部で選択されたマスタデータから、推論部で取得された排出関連情報に対応する排出係数を検索する検索部と、検索された排出係数に基づいて、温室効果ガスの排出量を算出する算出部と、を備える。
【選択図】 図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15