IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ デロイトトーマツコンサルティング合同会社の特許一覧

特開2024-172310判定装置、判定方法およびプログラム
<>
  • 特開-判定装置、判定方法およびプログラム 図1
  • 特開-判定装置、判定方法およびプログラム 図2
  • 特開-判定装置、判定方法およびプログラム 図3
  • 特開-判定装置、判定方法およびプログラム 図4
  • 特開-判定装置、判定方法およびプログラム 図5
  • 特開-判定装置、判定方法およびプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024172310
(43)【公開日】2024-12-12
(54)【発明の名称】判定装置、判定方法およびプログラム
(51)【国際特許分類】
   G06F 16/35 20190101AFI20241205BHJP
   G06F 16/90 20190101ALI20241205BHJP
【FI】
G06F16/35
G06F16/90
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023089939
(22)【出願日】2023-05-31
(71)【出願人】
【識別番号】515202391
【氏名又は名称】デロイトトーマツコンサルティング合同会社
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【弁理士】
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100153729
【弁理士】
【氏名又は名称】森本 有一
(74)【代理人】
【氏名又は名称】阿形 直起
(72)【発明者】
【氏名】井上 愼一
(72)【発明者】
【氏名】田中 孝明
(72)【発明者】
【氏名】角田 啓介
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FA03
5B175FB04
(57)【要約】
【課題】気候変動に関するシナリオに対する世論の方向性を判定することを可能とする判定装置等を提供する。
【解決手段】判定装置は、文章が入力された場合に、文章が気候変動に関するシナリオに対応するか否かを示す情報を出力するように学習された学習済みモデルを記憶する記憶部と、文章を含む記事データを取得する取得部と、学習済みモデルを用いて、記事データに含まれる文章がシナリオに対応するか否かを判定する判定部と、判定の結果を出力する出力部と、を有する。
【選択図】図4
【特許請求の範囲】
【請求項1】
文章が入力された場合に、当該文章が気候変動に関するシナリオに対応するか否かを示す情報を出力するように学習された学習済みモデルを記憶する記憶部と、
文章を含む記事データを取得する取得部と、
前記学習済みモデルを用いて、前記記事データに含まれる文章が前記シナリオに対応するか否かを判定する判定部と、
前記判定の結果を出力する出力部と、
を有することを特徴とする判定装置。
【請求項2】
前記記事データに含まれる文章を複数の文に分割する分割部をさらに有し、
前記判定部は、前記学習済みモデルを用いて各文が前記シナリオに対応するか否かを判定し、各文の判定の結果に基づいて前記文章が前記シナリオに対応するか否かを判定する、
請求項1に記載の判定装置。
【請求項3】
前記判定部は、前記文章を分割した複数の文のうちの少なくとも一つの文が前記シナリオに対応すると判定された場合に、当該文を含む文章が前記シナリオに対応すると判定する、
請求項2に記載の判定装置。
【請求項4】
前記記事データは、生成時刻をさらに含み、
前記出力部は、前記生成時刻に基づいて、前記シナリオに対応すると判定された記事データの数の経時変化を出力する、
請求項3に記載の判定装置。
【請求項5】
前記記憶部は、複数の学習済みモデルであって、文章が入力された場合に当該文章が複数の前記シナリオのうちの1つに対応するか否かを示す情報を出力するように学習された複数の学習済みモデルを記憶し、
前記判定部は、前記記事データに含まれる文章を前記複数の学習済みモデルのそれぞれに入力することにより、当該文章が前記複数のシナリオのそれぞれに対応するか否かを判定する、
請求項1に記載の判定装置。
【請求項6】
前記学習済みモデルは、自然言語によって事前学習がされたBERT(Bidirectional Encoder Representations from Transformers)またはSentence BERTに、教師データを用いた追加学習をしたモデルである、
請求項1に記載の判定装置。
【請求項7】
文章が入力された場合に、当該文章が気候変動に関するシナリオに対応するか否かを示す情報を出力するように学習された学習済みモデルを記憶し、
文章を含む記事データを取得し、
前記学習済みモデルを用いて、前記記事データに含まれる文章が前記シナリオに対応するか否かを判定し、
前記判定の結果を出力する、
ことを含むことを特徴とする判定方法。
【請求項8】
文章が入力された場合に、当該文章が気候変動に関するシナリオに対応するか否かを示す情報を出力するように学習された学習済みモデルを記憶する記憶部を有するコンピュータのプログラムであって、
文章を含む記事データを取得し、
前記学習済みモデルを用いて、前記記事データに含まれる文章が前記シナリオに対応するか否かを判定し、
前記判定の結果を出力する、
ことを前記コンピュータに実行させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、判定装置、判定方法およびプログラムに関する。
【背景技術】
【0002】
近年、地球温暖化等の気候変動への関心が高まっている。企業は、自社の事業に対する気候変動の影響を予測して経営戦略に組み込むことが求められている。しかしながら、気候変動の先行きは不確実性が高く、かつ気候変動対策等の人為的介入によって変化する。したがって、その予測は技術的に困難である。そこで、インターネット上に掲載されている記事の情報を分析して得られる世論の方向性を経営戦略策定のための材料とすることが考えられる。
【0003】
特許文献1には、消費者によって検索エンジンサイトに入力されたキーワードが消費者の関心を集めているキーワード等であるか否かを判定するキーワード分析システムが記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003-196301号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、気候変動については様々なシナリオが提唱されており、各シナリオに対する様々な議論も展開されている。したがって、インターネット上に掲載されている記事に含まれるキーワードの分析のみにより気候変動に対する世論の方向性を判断することは難しい。
【0006】
本発明は上述の課題を解決するためになされたものであり、気候変動に関するシナリオに対する世論の方向性を判定することを可能とする判定装置、判定方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の実施形態に係る判定装置は、文章が入力された場合に、文章が気候変動に関するシナリオに対応するか否かを示す情報を出力するように学習された学習済みモデルを記憶する記憶部と、文章を含む記事データを取得する取得部と、学習済みモデルを用いて、記事データに含まれる文章がシナリオに対応するか否かを判定する判定部と、判定の結果を出力する出力部と、を有することを特徴とする。
【0008】
また、判定装置は、記事データに含まれる文章を複数の文に分割する分割部をさらに有し、判定部は、学習済みモデルを用いて各文がシナリオに対応するか否かを判定し、各文の判定の結果に基づいて文章がシナリオに対応するか否かを判定することが好ましい。
【0009】
また、判定部は、文章を分割した複数の文のうちの少なくとも一つの文がシナリオに対応すると判定された場合に、文を含む文章がシナリオに対応すると判定することが好ましい。
【0010】
また、記事データは、生成時刻をさらに含み、出力部は、生成時刻に基づいて、シナリオに対応すると判定された記事データの数の経時変化を出力することが好ましい。
【0011】
また、記憶部は、複数の学習済みモデルであって、文章が入力された場合に文章が複数のシナリオのうちの1つに対応するか否かを示す情報を出力するように学習された複数の学習済みモデルを記憶し、判定部は、記事データに含まれる文章を複数の学習済みモデルのそれぞれに入力することにより、文章が複数のシナリオのそれぞれに対応するか否かを判定することが好ましい。
【0012】
また、学習済みモデルは、自然言語によって事前学習がされたBERT(Bidirectional Encoder Representations from Transformers)またはSentence BERTに、教師データを用いた追加学習をしたモデルであることが好ましい。
【0013】
本発明の実施形態に係る判定方法は、文章が入力された場合に、当該文章が気候変動に関するシナリオに対応するか否かを示す情報を出力するように学習された学習済みモデルを記憶し、文章を含む記事データを取得し、学習済みモデルを用いて、記事データに含まれる文章がシナリオに対応するか否かを判定し、判定の結果を出力する、ことを含むことを特徴とする判定方法。
【0014】
本発明の実施形態に係るプログラムは、文章が入力された場合に、当該文章が気候変動に関するシナリオに対応するか否かを示す情報を出力するように学習された学習済みモデルを記憶する記憶部を有するコンピュータのプログラムであって、文章を含む記事データを取得し、学習済みモデルを用いて、記事データに含まれる文章がシナリオに対応するか否かを判定し、判定の結果を出力する、ことをコンピュータに実行させることを特徴とする。
【発明の効果】
【0015】
本発明に係る判定装置、判定方法およびプログラムは、気候変動に関するシナリオに対する世論の方向性を判定することを可能とする
【図面の簡単な説明】
【0016】
図1】判定装置1の例示的な機能ブロック図である。
図2】記事データD1のデータ構造の例を示す図である。
図3】学習処理の流れの例を示すフロー図である。
図4】判定処理の流れの例を示すフロー図である。
図5】判定部134による判定の例を示す図である。
図6】判定結果画面の例を示す図である。
【発明を実施するための形態】
【0017】
以下、図面を参照しつつ、本発明の様々な実施形態について説明する。本発明の技術的範囲はそれらの実施形態に限定されず、特許請求の範囲に記載された発明及びその均等物に及ぶ点に留意されたい。
【0018】
図1は、本発明の実施形態に係る判定システム10の例示的な機能ブロック図である。判定システム10は、記事データに含まれる文章が気候変動に関する複数のシナリオのそれぞれに対応するか否かを判定する。
【0019】
複数のシナリオは、例えば、4℃シナリオ、2℃シナリオおよび1.5℃シナリオの3つのシナリオを含む。4℃シナリオおよび2℃シナリオは、2014年に発行されたIPCC(Intergovernmental Panel on Climate Change)の第5次評価報告書においてそれぞれRCP8.5シナリオおよびRCP2.6シナリオとして提唱された。4℃シナリオは、追加的な気候変動の緩和策がとられなかった場合を想定したシナリオであり、21世紀末における平均地上気温の産業革命期に対する上昇幅が約4℃であると予測する。2℃シナリオは、追加的な気候変動の緩和策がとられた場合を想定したシナリオであり、21世紀末における平均地上気温の産業革命期に対する上昇幅が約2℃であると予測する。1.5℃シナリオは、2018年に採択されたIPCCの1.5℃特別報告書において提唱された。1.5℃シナリオは、2050年にカーボンニュートラルが実現される場合を想定したシナリオであり、21世紀末における平均地上気温の産業革命期に対する上昇幅が1.5℃未満であると予測する。
【0020】
特定のシナリオに対応する文章とは、特定のシナリオに肯定的な文章をいい、例えば、特定のシナリオを支持する文章、特定のシナリオを前提とする文章、特定のシナリオとは異なるシナリオを否定する文章等を含む。判定装置1は、特定の文章が複数のシナリオのうちの1つのシナリオまたは2つ以上のシナリオに対応すると判定してもよく、複数のシナリオのいずれにも対応しないと判定してもよい。
【0021】
判定システム10は、判定装置1および通信端末2を有する。判定装置1と通信端末2とは、インターネット等のネットワークNを介して通信する。
【0022】
判定装置1は、サーバである。判定装置1は、パブリッククラウド上のサーバでもよく、オンプレミスのサーバでもよい。判定装置1は、記憶部11、通信部12および処理部13を有する。
【0023】
記憶部11は、プログラムおよびデータを記憶するための構成であり、例えば半導体メモリ等の記憶装置を備える。記憶部11が記憶するプログラムは、処理部13による処理に用いられるオペレーティングシステムプログラム、ドライバプログラム、アプリケーションプログラム等である。プログラムは、ビジネスインテリジェンスソフトウェアを含んでもよい。例えば、プログラムは、パブリッククラウドのマネージドサービスとして提供される。プログラムは、Docker等の仮想化技術によってコンテナ化されたイメージファイルを元に記憶部11にインストールされる。プログラムは、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)等のコンピュータ読み取り可能かつ非一時的な可搬型記憶媒体から記憶部11にインストールされてもよい。
【0024】
通信部12は、判定装置1を通信端末2と通信可能にするための構成であり、通信インタフェース回路を備える。通信部12が備える通信インタフェース回路は、無線LAN(Local Area Network)、有線LAN等の通信インタフェース回路である。通信部12は、処理部13から供給されたデータを他の装置に送信するとともに、他の装置から受信したデータを処理部13に供給する。
【0025】
処理部13は、判定装置1の動作を統括的に制御するための構成であり、一つまたは複数のプロセッサおよび周辺回路を備える。処理部13は、例えばCPU(Central Processing Unit)を備える。処理部13は、GPU(Graphics Processing Unit)、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等を備えてもよい。処理部13は、記憶部11に記憶されたプログラムに基づいて各種の処理を実行する。
【0026】
処理部13は、学習部131、取得部132、分割部133、判定部134および出力部135を機能ブロックとして有する。これらの各部は、処理部13がプログラムを実行することによって実現される機能モジュールである。これらの各部は、専用の処理回路として判定装置1に実装されてもよい。
【0027】
通信端末2は、PC(Personal Computer)、タブレット端末、スマートフォン、携帯電話機等の情報処理端末である。通信端末2は、ユーザの操作を受け付け、受け付けた操作に応じた信号を生成して判定装置1に送信する。また、通信端末2は、判定装置1から表示データを受信し、受信した表示データに基づいてディスプレイ等の表示装置に画像を表示する。
【0028】
図2は、記憶部11に記憶される記事データテーブルT1のデータ構造の例を示す図である。記事データテーブルT1は、インターネット上のニュースサイト等のウェブサイトに公開されている記事から抽出された複数の記事データを記憶する。
【0029】
記事データは、記事のURL(Uniform Resource Locator)、本文および生成時刻を含む。本文は、記事の内容にあたる文章である。記事がHTML(Hypertext Markup Language)データである場合、本文は、bodyタグが付された文章であってよい。生成時刻は、記事がウェブサイトに公開された時刻である。生成時刻は、記事が最初にウェブサイトに公開された時刻でもよく、ウェブサイトに公開されている記事が更新された時刻でもよい。記事データテーブルT1に記憶されるデータは、ニュースサイト等から購入することによって取得されてもよいし、クローラ等のプログラムによって取得されてもよい。
【0030】
図3は、判定装置1によって実行される生成処理の流れの例を示す図である。生成処理は、文が入力された場合に、その文が気候変動に関する複数のシナリオのそれぞれに対応するか否かを示す情報を出力するように学習された学習済みモデルを生成する処理である。生成処理は、学習済みモデルの学習に用いられる教師データが記憶部11に記憶された状態で実行される。生成処理は、記憶部11に記憶されたプログラムに基づいて、処理部13が判定装置1の他の構成と協働することにより実現される。
【0031】
最初に、学習部131は、教師データを記憶部11から取得する(ステップS11)。教師データは、文と、その文が複数のシナリオのうちのいずれに対応するかを示すラベルとが関連付けられたデータである。教師データの文は、例えばピリオド(.)によって区切られる英文である。教師データの文は句点(。)によって区切られる日本語文でもよい。ラベルは、文が複数のシナリオのうちの一つのシナリオのみに対応することを示してもよく、二つ以上のシナリオに対応することを示してもよく、いずれのシナリオにも対応しないことを示してもよい。ラベルは、例えば、気候変動に関する見識を有するコンサルタントによって設定される。なお、ラベルはコンサルタント以外の気候変動に関する有識者が付与してもよい。ラベルは、アノテーションサービスまたは学習済みモデルを用いて付与してもよい。アノテーションサービスまたは学習済みモデルを用いて付与されたラベルは、人手で確認および修正されてもよい。
【0032】
次に、学習部131は、教師データを用いて学習モデルを学習させ、文が入力された場合に、文が気候変動に関する複数のシナリオのそれぞれに対応するか否かを示す情報を出力するように学習された学習済みモデルを生成する(ステップS12)。例えば、学習部131は、文が複数のシナリオのうちの相互に異なる1つのシナリオに対応するか否かを示す情報を出力するように学習された複数の学習済みモデルを生成する。すなわち、学習部131は、文が4℃シナリオに対応するか否かを示す情報を出力する第1学習済みモデル、文が2℃シナリオに対応するか否かを示す情報を出力する第2学習済みモデルおよび文が1.5℃シナリオに対応するか否かを示す情報を出力する第3学習済みモデルを生成する。
【0033】
例えば、複数の学習モデルのそれぞれは、自然言語によって事前学習がされたBERT(Bidirectional Encoder Representations from Transformers)である。事前学習がされたBERTは、ウェブサイトに公開されている公開モデルであってもよい。この場合、学習部131は、複数のBERTのそれぞれに、教師データを用いた追加学習をする。例えば、学習部131は、BERTに文が入力された場合にBERTから出力される、入力された文が特定のシナリオに対応するか否かを示す確信度の値が、入力された文のラベルによって示される値に近くなるようにBERTを学習させる。学習部131は、生成された複数の学習済みモデルを記憶部11に記憶する。以上で、生成処理は終了する。
【0034】
図4は、判定装置1によって実行される判定処理の流れの例を示す図である。判定処理は、記事データに含まれる文章が複数のシナリオのそれぞれに対応するか否かを判定する処理である。判定処理は、生成処理によって生成された学習済みモデルが記憶部11に記憶された状態で実行される。判定処理は、記憶部11に記憶されたプログラムに基づいて、処理部13が判定装置1の他の構成と協働することにより実現される。
【0035】
最初に、取得部132は、判定の対象となる記事データを取得する(ステップS21)。例えば、取得部132は、判定の対象となる期間を取得する。この場合、通信端末2は、判定の対象となる期間を入力するためのユーザの操作を受け付ける。取得部132は、ユーザの操作に応じた信号を通信端末2から受信することにより、判定の対象となる期間を取得する。取得部132は、記事データテーブルT1に記憶された記事データのうちから、入力された期間に生成時刻が含まれる記事データを取得する。
【0036】
次に、分割部133は、取得した記事データのうちのいずれかを選択する(ステップS22)。例えば、分割部133は、取得した記事データのうち、生成時刻が最も早いものを選択する。
【0037】
次に、分割部133は、選択された記事データに含まれる文章を複数の文に分割する(ステップS23)。例えば、分割部133は、記事データに含まれる文章をピリオドによって区切ることにより、文章を複数の文に分割する。
【0038】
次に、判定部134は、複数の学習済みモデルを用いて、選択された記事データに含まれる文章が複数のシナリオのそれぞれに対応するか否かを判定する(ステップS24)。例えば、判定部134は、文章を分割した複数の文のそれぞれを複数の学習済みモデルのそれぞれに入力し、各文が各シナリオに対応するか否かを判定する。判定部134は、文章を分割した複数の文のうちの少なくとも一つの文が複数のシナリオのうちのいずれかに対応した場合に、その文が含まれる文章がそのシナリオに対応すると判定する。
【0039】
図5は、判定部134による判定の例を示す図である。図5に示す例では、選択された記事データに含まれる文章は、第1文~第3文の3文である。また、図5に示す例では、判定部134は、第1文および第3文がそれぞれ1.5℃シナリオおよび2℃シナリオに対応すると判定しており、第2文はいずれのシナリオにも対応しないと判定している。この場合、判定部134は、図5に示す文章を1.5℃シナリオおよび2℃シナリオに対応すると判定する。
【0040】
図4に戻り、次に、出力部135は、全ての記事データが選択されたか否かを判定する(ステップS25)。
【0041】
全ての記事データが選択されていない場合(ステップS25-No)、判定処理はステップS22に戻り、分割部133はまだ選択されていない記事データのうちのいずれかを選択する。
【0042】
全ての記事データが選択された場合(ステップS25-Yes)、出力部135は、判定の結果を出力する(ステップS26)。出力部135は、複数の記事データのうち、シナリオに対応すると判定された文章を含む記事データの数を出力する。
【0043】
例えば、出力部135は、記事データの生成時刻に基づいて、シナリオに対応すると判定された記事データの数の経時変化を出力する。この場合、出力部135は、複数の記事データの生成時刻が含まれる日ごとに複数のシナリオのそれぞれに対応すると判定された文章を含む記事データを計数する。出力部135は、各日についての記事データの数を示すグラフを含む判定結果画面の表示データを生成する。記事データの数は、実際の数でもよく、各日について取得された記事データの数に対する比率でもよい。出力部135は、生成された表示データを通信端末2に送信して、通信端末2に判定結果画面を表示する。以上で、判定処理を終了する。
【0044】
図6は、通信端末2に表示される判定結果画面の例を示す図である。判定結果画面に含まれるグラフの横軸は記事の生成時刻、縦軸は各シナリオに対応する文章を含む記事データの数である。図6によれば、米国でのパリ協定離脱の機運が高まった2017年から2019年頃(矩形61にて図示)に、4℃シナリオに対応する記事データの数が増加しており、2℃シナリオに対応する記事データの数が減少している。また、カーボンニュートラルに対する機運が高まった2021年以降に、4℃シナリオに対応する記事データの数が減少しており、1.5℃シナリオおよび2℃シナリオに対応する記事データの数が増加している(矩形62および63にて図示)。このように、記事データを計数することにより、気候変動に関するシナリオに対する世論の方向性を判定することができる。
【0045】
以上説明したように、判定装置1は、学習済みモデルを用いて、記事データに含まれる文章が気候変動に関するシナリオに対応するか否かを判定する判定部134を有する。これにより、判定装置1は、気候変動に関するシナリオに対する世論の方向性を判定することを可能とする。
【0046】
また、判定装置1は、記事データに含まれる文章を複数の文に分割する分割部133をさらに有し、判定部134は、各文がシナリオに対応するか否かを判定し、各文の判定の結果に基づいて文章がシナリオに対応するか否かを判定する。判定を文に対して行うことにより、判定を文章に対して行う場合よりも学習が容易になる。したがって、判定装置1は、より少ない教師データで気候変動に関するシナリオに対する世論の方向性を判定することを可能とする。
【0047】
また、判定部134は、文章を分割した複数の文のうちの少なくとも一つの文がシナリオに対応すると判定された場合に、文を含む文章がシナリオに対応すると判定する。これにより、判定装置1は、文章がシナリオに対応するか否かを容易に判定することを可能とする。
【0048】
また、出力部135は、記事データの生成時刻に基づいて、シナリオに対応すると判定された記事データの数の経時変化を出力する。これにより、判定装置1は、世論の方向性の時間変化を判定することを可能とする。
【0049】
また、記憶部11は、複数の学習済みモデルであって、文章が入力された場合に文章が複数のシナリオのうちの1つに対応するか否かを示す情報を出力するように学習された複数の学習済みモデルを記憶する。判定部134は、記事データに含まれる文章を複数の学習済みモデルのそれぞれに入力することにより、文章が複数のシナリオのそれぞれに対応するか否かを判定する。このようにすることで、判定の対象となるシナリオが新たに追加された場合に、そのシナリオに対応するか否かを判定する学習済みモデルを追加することにより対処することができる。すなわち、判定装置1は、システムの追加に対応するための拡張性を高めることを可能とする。
【0050】
また、学習済みモデルは、自然言語によって事前学習がされたBERTに、教師データを用いた追加学習をしたモデルである。BERTは事前学習がされているため、より少ない教師データおよび学習期間で文がシナリオに対応するか否かを高精度に判定することができる。したがって、判定装置1は、文章がシナリオに対応するか否かをより容易に判定することを可能とする。
【0051】
判定装置1には、次に述べるような変形例が適用されてもよい。
【0052】
上述した実施形態では、判定装置1は、文章が気候変動に関するシナリオに対応するか否かを判定するものとした。このような例に限られず、判定装置1は、文章が、貧困、エネルギー問題、生物多様性保全等の他のテーマに関するシナリオに対応するか否かを判定するものとしてもよい。このように、判定装置1は、不確実性が高く定量化が難しい様々なテーマに関するシナリオに対する世論の方向性を判定することができる。
【0053】
上述した実施形態では、判定処理のステップS22において分割部133は記事データに含まれる文章を複数の文に分割するものとした。このような例に限られず、分割部133は記事データを分割しなくてもよい。この場合、学習部131は、複数の文からなる文章が入力された場合に文章がシナリオに対応するか否かを示す情報を出力するように学習モデルを学習させる。また、判定部134は、記事データに含まれる文章を学習済みモデルに入力することにより、文章が各シナリオに対応するか否かを判定する。このようにすることで、判定装置1は、文章が各シナリオに対応するか否かを、文章の流れを考慮してより適切に判定することができる。
【0054】
上述した実施形態では、判定部134は、文章を分割した複数の文のうちの少なくとも一つの文がシナリオに対応すると判定された場合に、その文を含む文章がシナリオに対応すると判定するものとした。このような例に限られず、判定部134は、複数の文のうち所定数以上または所定割合以上の文がシナリオに対応すると判定された場合に、それらの文を含む文章がシナリオに対応すると判定してもよい。
【0055】
上述した実施形態では、記憶部11は、文章が複数のシナリオのうちの1つに対応するか否かを示す情報をそれぞれ出力する複数の学習済みモデルを記憶するものとした。このような例に限られず、記憶部11は、文章が複数のシナリオのそれぞれに対応するか否かを示す情報を出力する1つの学習済みモデルを記憶するものとしてもよい。これにより、判定装置1は、複数の学習済みモデルを記憶および使用することなく、少ない記憶容量および処理負荷で文章が複数のシナリオのそれぞれに対応するか否かを判定することができる。
【0056】
上述した実施形態では、判定部134は、文章が複数のシナリオのそれぞれに対応するか否かを判定するものとした。このような例に限られず、判定部134は、文章が一つのシナリオに対応するか否かのみを判定してもよく、4つ以上のシナリオのそれぞれに対応するか否かを判定してもよい。この場合、判定装置1は、シナリオの数に応じた学習済みモデルを生成して記憶する。
【0057】
上述した実施形態では、出力部135は、各日について、シナリオに対応すると判定された記事データの数を示すグラフを含む判定結果画面を出力するものとした。このような例に限られず、出力部135は、記事データの数を数値データとして出力してもよい。また、出力部135は、各週、各月等の任意の期間について、シナリオに対応すると判定された記事データの数を出力してもよい。
【0058】
上述した実施形態では、学習済みモデルは自然言語によって事前学習がされたBERTに、教師データを用いた追加学習をしたモデルであるものとした。このような例に限られず、学習済みモデルは、自然言語によって事前学習されたSentence BERTに教師データを用いた追加学習をしたモデルでもよい。また、学習済みモデルは、LSTM(Long-Short Term Memory)、Transformer、Word2Vec等の他のモデルに教師データを用いた学習をしたものでもよい。
【0059】
上述した判定装置1および通信端末2の機能は、一つの装置によって実現されてもよい。例えば、判定装置1および通信端末2の機能は、ディスプレイ等の表示部およびキーボード、キーパッド、マウス等の操作部を有するオンプレミスのサーバ、PC、タブレット端末、スマートフォン、携帯電話機等の情報処理装置によって実現されてもよい。この場合、判定装置1は、判定の結果を表示部に表示することにより出力する。また、上述した判定装置1の機能は、複数の装置によって実現されてもよい。
【0060】
上述した実施形態および各種の変形例は、本発明の範囲において適宜に組み合わされて実施されてよい。上述した各種の処理は、本発明の範囲において適宜に異なる順序で実行されてもよい。
【符号の説明】
【0061】
1 判定装置
11 記憶部
131 学習部
132 取得部
133 分割部
134 判定部
135 出力部
図1
図2
図3
図4
図5
図6