特許第6784788号(P6784788)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社三菱総合研究所の特許一覧 ▶ 北京大学の特許一覧 ▶ 株式会社天公システムの特許一覧 ▶ 北京天公瑞豊科技有限公司の特許一覧

特許6784788情報処理装置、情報処理方法及びプログラム
<>
  • 特許6784788-情報処理装置、情報処理方法及びプログラム 図000002
  • 特許6784788-情報処理装置、情報処理方法及びプログラム 図000003
  • 特許6784788-情報処理装置、情報処理方法及びプログラム 図000004
  • 特許6784788-情報処理装置、情報処理方法及びプログラム 図000005
  • 特許6784788-情報処理装置、情報処理方法及びプログラム 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6784788
(24)【登録日】2020年10月27日
(45)【発行日】2020年11月11日
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
   G06F 40/56 20200101AFI20201102BHJP
   G06F 16/30 20190101ALI20201102BHJP
【FI】
   G06F40/56
   G06F16/30
【請求項の数】9
【全頁数】15
(21)【出願番号】特願2019-30577(P2019-30577)
(22)【出願日】2019年2月22日
(65)【公開番号】特開2020-135628(P2020-135628A)
(43)【公開日】2020年8月31日
【審査請求日】2019年2月22日
(73)【特許権者】
【識別番号】591115475
【氏名又は名称】株式会社三菱総合研究所
(73)【特許権者】
【識別番号】507232478
【氏名又は名称】北京大学
【氏名又は名称原語表記】PEKING UNIVERSITY
(73)【特許権者】
【識別番号】519063495
【氏名又は名称】株式会社天公システム
(73)【特許権者】
【識別番号】519063509
【氏名又は名称】北京天公瑞豊科技有限公司
(74)【代理人】
【識別番号】230104019
【弁護士】
【氏名又は名称】大野 聖二
(74)【代理人】
【識別番号】230117802
【弁護士】
【氏名又は名称】大野 浩之
(72)【発明者】
【氏名】高橋 怜士
(72)【発明者】
【氏名】中村 智志
(72)【発明者】
【氏名】ワン シャオジュン
(72)【発明者】
【氏名】ザン ホンユイ
【審査官】 松尾 真人
(56)【参考文献】
【文献】 特開2011−008527(JP,A)
【文献】 特許第6155409(JP,B1)
【文献】 米国特許出願公開第2017/0147945(US,A1)
【文献】 特開2002−024507(JP,A)
【文献】 特開2018−049400(JP,A)
【文献】 米国特許出願公開第2014/0297565(US,A1)
【文献】 米国特許出願公開第2003/0074212(US,A1)
【文献】 村野 壮人,決算短信から抽出した業績要因文の事業セグメントに基づく分類と業績文の抽出,人工知能学 金融情報学研究会(SIG−FIN) 019 [online],人工知能学会,2017年10月11日,[2017年11月7日検索]Internet<URL:http://sigfin.org/?plugin=attach&refer=019-13&openfile=SIG-FIN-019-13.pdf>
【文献】 泉田 聡介,記述言語XBRLで書かれた財務諸表を対象とした分析支援ツールの試作,電子情報通信学会技術研究報告,社団法人電子情報通信学会,2005年 3月 8日,第104巻,第723号,pp.7〜11,SS2004−65
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00−40/191
16/00−16/958
G06Q 40/00−40/08
G06N 3/00−99/00
(57)【特許請求の範囲】
【請求項1】
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
前記作成部によって作成された文章を出力する出力部と、
を備え
前記決定部は人工知能機能を有し、
(1)決定部が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、人工知能機能を用いて過去の実績データに基づいて前記対象数値を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
(2)決定部が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、人工知能機能を用いて過去の実績データに基づいて前記対象数値の変化を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
前記作成部はテンプレートを使用せずに文章を作成可能となっている、情報処理装置。
【請求項2】
前記決定部は、第一期間に関する対象数値の評価及び第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、これらの評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する、請求項1に記載の情報処理装置。
【請求項3】
前記対象データは複数のセクションを含む財務諸表であり、
前記決定部は、対象セクション毎に前記利用項目及び前記利用数値を選択し、
前記作成部は、対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成する、請求項1又は2のいずれか1項に記載の情報処理装置。
【請求項4】
外部装置にアップロードされた対象データを検出して読み出す抽出部を備える、請求項1乃至3のいずれか1項に記載の情報処理装置。
【請求項5】
前記決定部によって必ず選択される対象項目を指定可能となる、請求項1乃至4のいずれか1項に記載の情報処理装置。
【請求項6】
前記作成部によって作成された文章の分量が閾値以上になっているか又は利用項目の個数が閾値以上となっているかどうかを判断する判断部を備え、
前記文章の分量又は前記利用項目の個数が閾値以上になっている場合には、前記作成部が要約文書を作成し、
前記出力部は前記要約文書を出力する、請求項1乃至のいずれか1項に記載の情報処理装置。
【請求項7】
前記作成部が文章を作成する際の評価レベルを調整可能となる、請求項1乃至のいずれか1項に記載の情報処理装置。
【請求項8】
情報処理装置を用いた情報処理方法であって、
決定部が、記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み出す工程と、
決定部が、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行う工程と、
決定部が、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する工程と、
作成部が、選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する工程と、
出力部が、作成された文章を出力する工程と、
を備え
前記決定部は人工知能機能を有し、
(1)決定部が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、人工知能機能を用いて過去の実績データに基づいて前記対象数値を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
(2)決定部が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、人工知能機能を用いて過去の実績データに基づいて前記対象数値の変化を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
前記作成部はテンプレートを使用せずに文章を作成可能となっている、情報処理方法。
【請求項9】
情報処理装置にインストールするためのプログラムであって、
プログラムをインストールされた情報処理装置は、
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
前記作成部によって作成された文章を出力する出力部と、
を備え
前記決定部は人工知能機能を有し、
(1)決定部が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、人工知能機能を用いて過去の実績データに基づいて前記対象数値を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
(2)決定部が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、人工知能機能を用いて過去の実績データに基づいて前記対象数値の変化を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
前記作成部はテンプレートを使用せずに文章を作成可能となっている、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、項目及び当該項目に対する数値を含む対象データから当該対象データを説明するための文章を作成する情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
従来から情報処理装置によって自動で文章を作成することが試みられている。特許文献1では、人工知能アルゴリズムを用いて自然言語の解析をおこなう自然言語処理装置において、入力部が、ある自然言語に対する複数の手話画像を当該自然言語ごとに当該自然言語と関連付けして入力し、手話動作解析部が、入力された手話画像から、手話動作の複数の特徴点を抽出し、抽出された特徴点ごとに手話動作の、他の手話動作との共通点または相違点を解析し、推測部が、解析された共通点または相違点から、自然言語の意味内容について推測し、記憶部が、推測された意味内容に関する情報を、自然言語と関連付けして記憶することも提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第6301427号
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、項目及び当該項目に対する数値を含む対象データから当該対象データを説明するための文章を作成する技術を提供する。
【課題を解決するための手段】
【0005】
本発明による情報処理装置は、
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
前記作成部によって作成された文章を出力する出力部と、
を備えてもよい。
【0006】
本発明による情報処理装置において、
前記決定部は、第一期間に関する対象数値の評価及び第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、これらの評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択してもよい。
【0007】
本発明による情報処理装置において、
前記対象データは複数のセクションを含む財務諸表であり、
前記決定部は、対象セクション毎に前記利用項目及び前記利用数値を選択し、
前記作成部は、対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成してもよい。
【0008】
本発明による情報処理装置は、
外部装置にアップロードされた対象データを検出して読み出す抽出部を備えてもよい。
【0009】
本発明による情報処理装置において、
前記決定部によって必ず選択される対象項目を指定可能となってもよい。
【0010】
本発明による情報処理装置において、
前記決定部は人工知能機能を有し、
(1)決定部が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、過去の実績データに基づいて前記対象数値を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択し、
(2)決定部が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する場合には、決定部は、過去の実績データに基づいて前記対象数値の変化を評価し、当該評価の結果を用いて前記対象数値から利用する利用数値を選択してもよい。
【0011】
本発明による情報処理装置は、
前記作成部によって作成された文章の分量が閾値以上になっているか又は利用項目の個数が閾値以上となっているかどうかを判断する判断部を備え、
前記文章の分量又は前記利用項目の個数が閾値以上になっている場合には、前記作成部が要約文書を作成し、
前記出力部は前記要約文書を出力してもよい。
【0012】
本発明による情報処理装置において、
前記作成部が文章を作成する際の評価レベルを調整可能となってもよい。
【0013】
本発明による情報処理方法は、
情報処理装置を用いた情報処理方法であって、
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み出す工程と、
第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行う工程と、
当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する工程と、
選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する工程と、
作成された文章を出力する工程と、
を備えてもよい。
【0014】
本発明によるプログラムは、
情報処理装置にインストールするためのプログラムであって、
プログラムをインストールされた情報処理装置は、
記憶部に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価又は第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて前記対象項目及び前記対象数値から利用する利用項目及び利用数値を選択する決定部と、
前記決定部によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部と、
前記作成部によって作成された文章を出力する出力部と、
を備えてもよい。
【発明の効果】
【0015】
本発明において、対象データに含まれる第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択し、選択された利用項目及び利用数値に補充用語を補充することで文章を作成する態様を採用した場合には、対象数値の評価結果(数値評価結果)に基づいて、自動的に報告文書等の文章を作成することができる。
【図面の簡単な説明】
【0016】
図1図1は、本発明の実施の形態による情報処理装置の構成を示した概略ブロック図である。
図2図2(a)は、本発明の実施の形態で用いられ得るキャッシュ・フロー計算書を示し、図2(b)は図2(a)のキャッシュ・フロー計算書から文章を作成した結果の一例を示す図である。
図3図3は、本発明の実施の形態において人工知能機能を有する作成部が作成した文章と、人が作成した文章とを比較して示したものである。
図4図4は、本発明の実施の形態で用いられ得るキャッシュ・フロー計算書から文章を作成する工程を説明するための図である。
図5図5(a)は図4に続いて行われる処理内容を示す図であり、図5(b)は図5(a)に続いて行われる処理内容を示す図であり、図5(c)は図4に続いて行われる処理内容を示す図である。
【発明を実施するための形態】
【0017】
実施の形態
《構成》
本実施の形態の情報処理装置は、一つの装置から構成されてもよいし複数の装置から構成されてもよい。また、複数の装置から情報処理装置が構成される場合には、各装置が同じ部屋等の同じ空間に設けられる必要はなく、異なる部屋、異なる建物、異なる地域等に設けられてもよい。本実施の形態では「及び/又は」を用いて説明することもあるが、「又は」という文言は「及び」の意味も含んでいる。つまり、A又はBという文言は、A単独、B単独、並びに、A及びBを含んだ概念である。
【0018】
図1に示すように、情報処理装置は、記憶部40と、記憶部40に記憶されている複数の対象項目及び対象項目に紐づけられた対象数値を含む対象データを読み込み、第一期間に関する対象数値の評価を行い、当該評価の結果(以下「数値評価結果」とも言う。)を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する決定部10と、決定部10によって選択された利用項目及び利用数値に、補充用語を補充することで文章を作成する作成部20と、作成部20によって作成された文章を出力する出力部30と、を有してもよい。対象データは典型的には項目と当該項目に対する数値を示す数表である。出力部30で出力された内容は表示画面等の表示部150で表示されてもよい。表示部150は本実施の形態の情報処理装置が提供するサービスを利用するユーザが管理するものであってもよい。
【0019】
決定部10は、第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果(以下「変化評価結果」とも言う。)を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択してもよい。第二期間と第一期間とは同じ長さとなってもよく、例えば、第二期間及び第一期間の各々は1年となってもよいし、3月となってもよい。
【0020】
決定部10は、数値評価結果において第一閾値を超える対象項目を利用項目として選択してもよい。決定部10は、変化評価結果において第二閾値を超える対象項目を利用項目として選択してもよい。数値評価結果及び変化評価結果はいずれか一方だけが利用されてもよいし、両方が利用されてもよい。第一閾値及び第二閾値は絶対値であってもよいし、相対的な比率であってもよい。なお、数値評価及び変化評価は後述するように人工知能機能を用いて行われてもよい。
【0021】
第一閾値を超える対象項目が多数存在する場合には、決定部10は、第一個数を上限として評価値の高いものから順番に対象項目を利用項目として選択してもよい。同様に、第二閾値を超える対象項目が多数存在する場合には、決定部10は、第二個数を上限として評価値の高いものから順番に対象項目を利用項目として選択してもよい。これら評価値は変化値の絶対的な値だけではなく、当該項目の持つ意味も考慮して決定されてもよく、変化することに重要な意味のある項目では、変化値が小さい場合であっても高い評価値となってもよい。
【0022】
対象データの大まかな構造部分はパソコン等の操作部80から入力されてもよい。一例として対象データがキャッシュ・フロー計算書である場合には、キャッシュ・フロー計算書から作成される文章が4つのセクションで構成されることや各セクションで用いられるキーワードが操作部80から入力されてもよいし、さらに情報を入力するのであれば、キャッシュ・フロー計算書から作成される文章が「サマリー」「営業CF」「財務CF」及び「投資CF」の4つのセクションで構成されることが操作部80から入力されてもよい。
【0023】
対象データは一つの文章であってもよいが、これに限られることはなく、複数の文章が組み合わされてもよい。この場合、第1対象データの他に、第2対象データ、第3対象データ、・・・、第n対象データ(「n」は2以上の整数である。)に含まれる情報を用いて作成部20が文章を作成してもよい。第1対象データの情報を主として用い、その他の対象データの情報を副次的に用いてもよい。例えば、対象企業のキャッシュ・フロー計算書から文章を作成する際に、キャッシュ・フロー計算書の他に当該対象企業の貸借対照表及び損益計算書の情報も決定部10が読み出して利用項目及び利用数値を選択し、選択された利用項目及び利用数値を用いて作成部20が文章を作成してもよい。また、当該対象企業の個別財務諸表だけではなく連結財務諸表を決定部10が読み出して、決定部10によって選択された利用項目及び利用数値を用いて作成部20が文章を作成してもよい。
【0024】
対象データが財務諸表である場合、対象データにおける金額又は金額変化が同じ値であっても対象企業の売上高、純利益、純資本等の金額によってインパクトは異なる。このため、対象となっている数表からなる第1対象データの他に、数表からなる第2対象データ、第3対象データ、・・・、第n対象データを利用することは有益である。
【0025】
対象データは財務諸表であってもよく、より具体的には複数のセクションを含む財務諸表であってもよい。決定部10は、対象セクション毎に利用項目及び利用数値を選択してもよい。作成部20は、対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成してもよい。なお、対象データとしては項目と当該項目に対する数値を含む数表であればよく、例えば、地方自治体等における人口、平均年齢等を含む数表や、警察が発行している事故統計からなる数表等であってもよい。
【0026】
財務諸表としては様々なものを挙げることができ、貸借対照表、損益計算書、キャッシュ・フロー計算書、株主資本等変動計算書等を挙げることができる。また、財務諸表としては、個別財務諸表であってもよいし連結財務諸表であってもよい。
【0027】
対象となる文書が財務諸表である場合であれば、第一期間は、例えば会計年度であれば1年であり、四半期であれば3か月である。
【0028】
一例としては図2(a)で示されているキャッシュ・フロー計算書の営業キャッシュ・フローに基づいて、「「営業活動によるキャッシュ・フロー」は、「3,215百万円の支出」(前年同四半期は「5,653百万円の支出」)となりました。これは、季節要因による「売上債権の増加6,393百万円」、「たな卸資産の増加5,643百万円」、「仕入債務の増加5,627百万円」等によるものです。」(図2(b))というような文章が作成部20によって作成されてもよい。営業キャッシュ・フローで示されている項目及び数値以外の内容は作成部20によって補充された補充用語である。この補充用語は記憶部40で記憶されており、作成部20が決定部10で選択された利用項目及び利用数値の意味を考慮して適宜選択することで、読み出されて文書内で利用されることになる。補充用語としては、様々なものを用いることができ、過去に作成された文章から抽出された用語が補充用語として記憶されてもよいし、ウェブサイトを介して取得された用語も補充用語として記憶されるようにしてもよい。
【0029】
サーバやクラウド等の外部装置200にアップロードされた財務諸表等の対象データを検出して読み出す抽出部50が設けられてもよい(図1参照)。外部装置200は例えばEDINETであってもよい。抽出部50によって読み出された財務諸表に対して、決定部10が利用数値を選択するとともに数値評価結果及び/又は変化評価結果を決定し、作成部20が選択された利用数値と数値評価結果及び/又は変化評価結果とを用いて文章を作成してもよい。
【0030】
決定部10によって必ず選択される対象項目(必須利用項目)が指定可能となってもよい。対象データが財務諸表からなる場合には、新株発行に関する項目は必ず選択される利用項目として指定されるようにしてもよい。また、純資本がマイナスとなっている場合には、「純資本」が利用項目として決定部10によって必ず選択されるようにしてもよい。また、結論部分は必須利用項目となってもよく、図2(a)に示す「営業活動によるキャッシュ・フロー」に関しては、結論である「営業活動によるキャッシュ・フロー」(図2(a)の末尾に示されている項目)が必須利用項目となってもよい。
【0031】
決定部10及び作成部20は人工知能機能を有してもよい。決定部10が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合には、決定部10は、過去の実績データに基づいて対象数値を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択してもよい。決定部10が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合には、決定部10は、過去の実績データに基づいて対象数値の変化を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択してもよい。過去の実績データには、対象となっている企業の過去の実績データだけではなく、その他の多数の企業の過去の実績データが含まれてもよい。これらのデータは記憶部40に記憶されていてもよいし、外部装置200で記憶されているものを抽出部50が抽出するようにしてもよい。
【0032】
財務諸表が対象データである場合には、第一期間は例えば当期(今年度の会計期間)であり、第二期間は例えば前期(前年度の会計期間)であり、両者は同じ長さ(1年)となっている。また四半期で比較する場合には、例えば、第一期間が当期の第1四半期である場合には第二期間は前期の第1四半期であり、第一期間が当期の第2四半期である場合には第二期間は前期の第2四半期であり、第一期間が当期の第3四半期である場合には第二期間は前期の第3四半期であり、第一期間が当期の第4四半期である場合には第二期間は前期の第4四半期であるというように、対応する四半期が比較対象となってもよい。また、第二期間よりも前の期間(例えば前々期等)における対象数値からの変化を考慮してもよい。また、図2に示すように同じ四半期までの累計期間を比較対象としてもよい(図2では第2四半期までの累計期間で比較されている。)。
【0033】
人工知能機能を有する作成部20は、テンプレート(ひな型)を使用せず、数表と説明文のデータのみを用いて学習してもよい。このようにテンプレートを利用しない場合には、予めの準備が必要ない点で有益である。
【0034】
作成部20は、決定部10によって選択された利用項目及び利用数値の内容から、対象企業の事業がどのような状況にあるか、つまり好調なのか不調なのかの結果を文章として示すようにしてもよい。変動項目が多く多数の利用項目が選択される場合には、事業が好調で多くの項目で数値が変動していることもあれば、事業が不調で多くの項目での数値が変動していることの両方があり得る。このような場合には、好調・不調の結果を作成部20が文章として示すようにしてもよい。この際、数値を用いた表現は行わず、好調であるのか又は不調であるのかだけを示すようにしてもよい。但し、これに限られることはなく、数値を用いつつ、好調・不調の結果を作成部20が文章として示すようにしてもよい。
【0035】
作成部20によって作成された文章の分量が閾値(第三閾値)以上になっているか又は利用項目の個数が閾値(第四閾値)以上となっているかどうかを判断する判断部60が設けられてもよい。文章の分量又は利用項目の個数が閾値以上になっている場合には、作成部20が要約文書を作成してもよい。出力部30は要約文書を出力してもよい。この場合、作成部20は、要約文章として、対象企業の事業がどのような状況にあるのかだけを示す文章を作成するようにしてもよい。出力部30は対象データにおける財務諸表等の数表と作成部20が作成した文書とを並列で示すようにしてもよい。このような態様を採用する場合には、数表と文書とを並列で確認でき、数表の持つ意味を投資家等の利用者に提供できる。
【0036】
作成部20はLSTM(Long Short Term Memory:長期短期記憶)によって文章を作成するようにしてもよい。LSTMはニューラルネットワークのうちRNN(リカレントニューラルネットワーク)に分類されるものである。RNNは時系列データを学習するためのニューラルネットワークで、LSTMはRNNの中でも繰り返し改善が施されたものである。LSTMを用いることで時系列データを考慮することができ、単語列の順序を考慮して学習することができる。学習方法としては、有価証券報告書であれば数万件(例えば2万〜5万件)の有価証券報告書を学習するようにしてもよい。機械学習に用いるためのソフトウェアライブラリであるTensorflowを用いてもよい。AIモデルとしては、Deep Learning(Seq2Seq系のモデル)を複数使用してもよい。機械学習を行う際にビームサーチを利用してもよいし、入力データと出力されたテキストで不整合がある場合にペナルティをかける強化学習を行ってもよい。
【0037】
また、人工知能機能の一例として、機械学習の手法を用いた分類器を用いてもよい。この分類器は、例えば、過去の実績データから、高い精度のベクトルを生成するように、機械学習技術によって、利用する採用変数(要素)と、その係数(重み)を定めてもよい。上記人工知能機能は、回帰分析、決定木分析等を行ってもよい。機械学習技術に関しては、様々なモデルを採用することができ、例えば、ロジスティクス回帰モデル、ランダムフォレストモデル、ツリーモデル等を採用することができる。
【0038】
発明者らが実際に実験を行った結果を図3に示す。図3の上側が人工知能機能を有する作成部20によって作成された文書であり、図3の下側が人間によって作成された文章である。人工知能機能を有する作成部20による大きな間違いは前年同期比の数字ではなく、前年同期の数字としてしまった部分のみであることを確認できた。「前年同期比」と「前年同期」は似た文脈で出てくることが多く、深層学習利用時に典型的な間違いであると評価できる。
【0039】
前処理として、対象データ中の対象項目及び対象数値について一定の規則に基づいてラベルを付与してもよい。一例として対象データがキャッシュ・フロー計算書である場合には、キャッシュ・フロー計算書中の項目名・数値に対して前期数値、今期数値、増減分、増減率のラベルを一定の規則に基づき付与してもよい。また前処理として、形態素解析エンジンであるMeCab等を用いて分かち書きを行ってもよい。
【0040】
また、対象データ中のセグメントのキーワードを設定してもよい。一例として対象データがキャッシュ・フロー計算書である場合には、サマリー、営業CF、財務CF、投資CFのキーワードを設定してもよい。
【0041】
「CONJ」(conjunction)が、利用項目と利用項目に対する利用数値に基づいて作成部20で決定されてもよい。「CONJ」は複数の「利用項目」が作成する文章で利用される場合に用いられる。「CONJ」としては「この結果」「原因は、」等の予め複数の単語列が記憶部40で記憶されており、これらの単語列から適切な用語が作成部20で選択されてもよい。
【0042】
「CONJ」としては、前述した「この結果」「原因は、」等のように、その後に理由を説明するための用語が用いられるようにしてもよい。この場合には、「CONJ」の前にある「利用項目」における「利用数値」の根拠を説明するための「利用項目」及び「利用数値」が「CONJ」の後に続くようにしてもよい。「CONJ」の配置場所は、選択された「利用項目」の関係から決定されてもよく、「A」「B」「C」という利用項目が選択され、「B」及び「C」が「A」の原因となる場合には、「A」「CONJ」「B」「C」という順番でこれらが配列されるようになってもよい。
【0043】
本実施の形態の決定部10、作成部20、出力部30、記憶部40、抽出部50、判断部60等の各部材は、一つ又は複数のICチップ又は電子モジュール等で実現されてもよいし、回路構成によって実現されてもよい。また、一つの電子部材が制御部となり、これら決定部10、作成部20、出力部30、抽出部50、判断部60等の各部材の機能を果たしてもよい。
【0044】
《方法》
主に図4及び図5を用いて、本実施の形態の情報処理装置を用いた情報処理方法の一例について説明する。この例では、対象データとしてキャッシュ・フロー計算書を用いて説明する。なお、ここでは一例を示しており、上記「構成」で述べた全ての態様及び下記「効果」で述べる全ての態様を「方法」において適用することができる。
【0045】
決定部10は、対象データであるキャッシュ・フロー計算書から作成される文章が「サマリー」「営業CF」「財務CF」「投資CF」の順で構成されるのか、又は「営業CF」「投資CF」「財務CF」「サマリー」の順で構成されるのかを決定する。決定部10は、図4に示す数表を説明する場合、過去の文章から統計的に、「サマリー」「営業CF」「財務CF」「投資CF」の順で作成するものであると判断し、そのように決定してもよいし、当該順番が操作部80で予め入力されていてもよい。
【0046】
次に、決定部10は、使用する数表項目(変数)、特殊記号(説明を表すCONJ)とその順番を決める。例えば、決定部10は、作成部20で作成される文書である「サマリー」の中で用いられるべき変数、特殊記号を選び、順番を決める。図4に示す数表から「サマリー」を書く場合、使用する項目とその順番は過去に作成された文章から統計的に「今年度の期末の現金」「CONJ」「今年度期首の現金」「純利益」であると判断してもよい(図5(a))。
【0047】
次に、作成部20は、数表と抽出された要素列「今年度の期末の現金」「CONJ」「今年度期首の現金」「純利益」から文を構成する場合、過去の文章から統計的に「今年度の期末の現金」と、「CONJ」「今年度期首の現金」及び「純利益」とで分割することが自然であると判断する(図5(b))。
【0048】
次に、分割された2つの文章の各々を作成する。
【0049】
文1については、作成部20は、利用項目である「今年度の期末の現金」及び利用数値である「〇○○」を用いて、「今年度の期末の現金同等物の残高は「○○○」円となりました。」という文章を作成する(図5(c))。
【0050】
同様に、文2については、「CONJ」である「その理由は」と、利用項目である「今年度期首の現金」及び利用数値である「△△△」と、利用項目である「純利益」及び利用数値である「□□□」とを用いて、「その理由は、期首の残高が「△△△」円であったところに、純利益が「□□□」であったためです。」という文章を作成する(図5(c))。なお、文1及び文2において、利用項目及び利用数値以外は補充用語である。
【0051】
決定部10は、前述したのと同様の処理を「営業CF」「財務CF」及び「投資CF」の各々のセクションに対しても行い、キャッシュ・フロー計算書から文章を作成する。なお、本実施の形態では日本語を用いる態様を用いて説明しているが、これに限られることはなく、英語、中国語、韓国語、ドイツ語、フランス語等の様々な言語を用いることができる。
【0052】
《効果》
次に、上述した構成からなる本実施の形態による効果であって、未だ説明していないものを中心に説明する。
【0053】
対象データに含まれる第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択し、選択された利用項目及び利用数値に補充用語を補充することで文章を作成する態様を採用した場合には、対象数値の評価結果(数値評価結果)に基づいて、自動的に報告文書等の文章を作成することができる。
【0054】
対象データに含まれる第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択し、選択された利用項目及び利用数値に補充用語を補充することで文章を作成する態様を採用した場合には、対象数値の変化結果(変化評価結果)に基づいて、自動的に報告文書等の文章を作成することができる。
【0055】
また、数値評価結果及び変化評価結果の両方を用いる場合には、数値評価結果及び変化評価結果の両方に基づいて、自動的に報告文書等の文章を作成することができる。
【0056】
数表から報告文書等の文書を自動で作成できれば、大量に数表を有している企業等が本実施の形態を採用することで、数表の内容を簡易な文書とすることができる。対象データが財務諸表である場合には、財務諸表に関する大量の情報を簡易な報告文書として作成でき、大量の財務諸表の分析作業の効率化を図れる。また、本実施の形態によれば、企業の財務担当、公認会計士、会計士事務所等が有価証券報告書を作成する際の下書きを予め準備することもできる。
【0057】
公表された財務諸表を要約することは従前から行われているが、このような要約は対象企業が発表した財務諸表と当該財務諸表に関する文章に基づいて作成されることから、当該対象企業の評価が入ることとなる。他方、本実施の形態によれば、例えば財務諸表という数表だけを用いて要約された文章を作成することから、客観的な財務諸表の数値に基づいて文章を作成することができる。
【0058】
なお、作成部20が文章を作成する際の評価レベルを調整可能となってもよい。評価レベルは操作部80からの入力によって調整可能となってもよい。同じ数値又は数値変化であったとしても、例えば、第一評価レベルでは厳しい評価を行って評価に関して厳しい内容からなる補充用語を用い(例えば「キャッシュが不足しており厳しい状況であります」とうような用語を用い)、第二評価レベルでは緩い評価を行って評価に関して緩やかな内容からなる補充用語を用い(例えば「現時点ではキャッシュがわずかに不足しておりますが、問題はございません」というような用語を用い)、第三評価レベルでは中立的な評価を行って評価に関して中立的な内容からなる補充用語を用いる(例えば「現時点ではキャッシュが不足しておりますが、中長期的に見れば問題はございません」という用語を用いる)ようにしてもよい。対象データが財務諸表に関するデータである場合であって企業の財務担当者が利用するときには、第二評価レベルを用いて緩やかな評価に基づいて文章を作成部20が作成することで、当該企業にとって財務上有利な評価されるように文章が作成されるようにしてもよい。他方、対象データが財務諸表に関するデータである場合であって投資家等の外部者が利用するときには、第一評価レベルを用いて厳しい評価に基づいて文章を作成部20が作成することで、当該企業にとって財務上不利な評価されるように文章が作成されるようにしてもよい。このような態様を採用することで、利用する対象者に応じて、目的に応じた文章の作成を期待できる。なお、企業の担当者が利用する場合であっても、第一評価レベルを用いて厳しい評価に基づいて作成部20が文章を作成するようにすることで、厳しい目で見た場合に、どのような評価を受けるかを予め確認するという利用も可能となる。
【0059】
対象データが複数のセクション(例えば「サマリー」「営業CF」「財務CF」及び「投資CF」というセクション)を含む財務諸表等である場合に、決定部10が対象セクション毎に利用項目及び利用数値を選択する態様を採用した場合には、対象セクション毎に利用項目及び利用数値を選択できる。
【0060】
また、作成部20が対象セクション毎にセクション文書を作成し、当該セクション文書を統合することで統合文書を作成する態様を採用した場合には、対象セクション毎に選択された利用項目及び利用数値を用いて、統合文書を作成できる。セクション文書を作成することで、当該セクション文書単位での利用も可能となる。
【0061】
外部装置200にアップロードされた対象データを検出して読み出す抽出部50が設けられる態様では、最新の財務諸表を自動的に読み出して報告文書を作成できる。抽出部50による読み出しは1週間に1回、1日に一回であってもよい。1日に一回の頻度の場合には、休日の際には抽出に行かないようにしてもよい。このような態様を採用した場合には財務諸表の速報をいち早く作成して投資家等に提供できる。
【0062】
決定部10によって必ず選択される対象項目を指定可能となる態様を採用する場合には、報告文書に当該内容を必ず組み入れることができる。対象データが財務諸表の場合には、投資家が特に注目する内容(例えば新株発行情報、純資本がマイナスになった情報等)を対象項目として指定することで、投資家にとって有益な情報を提供できる。
【0063】
人工知能機能を有する決定部10が、対象データに含まれている第一期間に関する対象数値の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合に、決定部10が過去の実績データに基づいて対象数値を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択する態様を採用した場合には、情報として意味の高い利用数値を精度よく選択でき、有益な情報提供を期待できる。
【0064】
人工知能機能を有する決定部10が、対象データに含まれている第二期間に関する対象数値に対する第一期間に関する対象数値の変化の評価を行い、当該評価の結果を用いて対象項目及び対象数値から利用する利用項目及び利用数値を選択する場合に、決定部10が過去の実績データに基づいて対象数値の変化を評価し、当該評価の結果を用いて対象数値から利用する利用数値を選択する態様を採用する場合にも、情報として意味の高い利用数値を精度よく選択でき、有益な情報提供を期待できる。
【0065】
作成部20によって作成された文章の分量が閾値以上になっているか又は利用項目の個数が閾値以上となっているかどうかを判断する判断部60が設けられ、文章の分量又は利用項目の個数が閾値以上になっている場合に作成部20が要約文書を作成する態様を採用した場合には、文章の分量を一定の範囲として情報提供を行うことができる。対象データが財務諸表である場合には、財務諸表に関する簡易なレポートを作成でき、投資家としては、対象企業の財務諸表の内容を簡易に理解することができる。
【0066】
上述した実施の形態の記載及び図面の開示は、特許請求の範囲に記載された発明を説明するための一例に過ぎず、上述した実施の形態の記載又は図面の開示によって特許請求の範囲に記載された発明が限定されることはない。
【符号の説明】
【0067】
10 決定部
20 作成部
30 出力部
40 記憶部
50 抽出部
60 判断部
図1
図2
図3
図4
図5