(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-09-24
(45)【発行日】2024-10-02
(54)【発明の名称】ニュースラベリングシステム及びニュースラベリングサーバ
(51)【国際特許分類】
G06F 16/951 20190101AFI20240925BHJP
G06Q 40/06 20120101ALI20240925BHJP
【FI】
G06F16/951
G06Q40/06
(21)【出願番号】P 2023055813
(22)【出願日】2023-03-30
【審査請求日】2023-03-30
【新規性喪失の例外の表示】特許法第30条第2項適用 <1> (1)ウェブサイトの掲載日 令和4年7月4日 (2)ウェブサイトのアドレス https://www.tr.mufg.jp/ippan/release/pdf_mutb/220704_1.pdf (3)公開者 三菱UFJ信託銀行株式会社 (4)公開された発明の内容 三菱UFJ信託銀行株式会社が、上記ウェブサイトにて、橋本育子及び菊地剛正が発明した「ニュースラベリングシステム及びニュースラベリングサーバ」について、「AI活用によるネガティブニュース記事ラベリングシステムの共同開発について」という記事により公開した。 <2> (1)ウェブサイトの掲載日 令和4年7月4日 (2)ウェブサイトのアドレス https://milize.co.jp/news/20220704_3194 (3)公開者 株式会社MILIZE (4)公開された発明の内容 株式会社MILIZEが、上記ウェブサイトにて、橋本育子及び菊地剛正が発明した「ニュースラベリングシステム及びニュースラベリングサーバ」について、「AIとFintechのMILIZEは、AI活用によるネガティブニュース記事ラベリングシステムを三菱UFJ信託銀行と共同開発」という記事により公開した。 <3> (1)発行日 令和5年2月23日 (2)刊行物 金融AI成功パターン、第302~317頁、株式会社日経BP (3)公開者 株式会社日経BP (4)公開された発明の内容 株式会社日経BPが、金融AI成功パターン、第302~317頁にて、橋本育子及び菊地剛正が発明した「ニュースラベリングシステム及びニュースラベリングサーバ」について、「第13章ネガティブニュースラベリングAI」という記事により公開した。
(73)【特許権者】
【識別番号】397041185
【氏名又は名称】三菱UFJ信託銀行株式会社
(74)【代理人】
【識別番号】100141025
【氏名又は名称】阿久津 勝久
(74)【代理人】
【識別番号】100147599
【氏名又は名称】丹羽 匡孝
(74)【代理人】
【識別番号】100098589
【氏名又は名称】西山 善章
(72)【発明者】
【氏名】橋本 育子
(72)【発明者】
【氏名】菊地 剛正
【審査官】原 秀人
(56)【参考文献】
【文献】特開2005-100222(JP,A)
【文献】特開2004-252971(JP,A)
【文献】米国特許出願公開第2022/0327567(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 40/06
(57)【特許請求の範囲】
【請求項1】
投資に関するニュースを含む複数のニュース情報をラベリング又は分類するニュースラベリングサーバであって、
前記ニュースラベリングサーバは、前記ニュース情報を取得する情報取得部と、前記情報取得部により取得された前記ニュース情報を記憶する取得情報データベースと、前記ニュース情報を前記取得情報データベースから読出してAIモデルを用いて処理するAI処理部と、AI処理部により処理されたAI処理済みニュース情報を記憶するAI処理情報データベースとを備え、
前記ニュースラベリングサーバの制御部又は前記AI処理部が、前記ニュース情報に含まれる企業名に対するマスキング処理を実行した後、前記AI処理部は、前記ニュース情報を複数のラベル又は分類にラベリング又は分類する処理と、前記複数のラベル又は分類ごとに、前記ニュース情報をスコアリングする処理とを実行する、ニュースラベリングサーバ。
【請求項2】
請求項1に記載のニュースラベリングサーバにおいて、
前記ニュース情報は、投資に関するネガティブ情報を含む、ニュースラベリングサーバ。
【請求項3】
請求項1に記載のニュースラベリングサーバにおいて、
前記
複数のラベル又は分類は、AML(アンチマネーロンダリング)又は経済制裁に関するラベルA、投資又は経済活動に関するラベルB、及び所定の用語(例えば、ネガティブワード)に関するラベルCを少なくとも含む、ニュースラベリングサーバ。
【請求項4】
請求項1に記載のニュースラベリングサーバにおいて、
前記情報取得部は、APIを用いて外部装置から前記ニュース情報を取得するAPI情報取得部、及び/又はウェブスクレイピングを用いて前記ニュース情報を取得するスクレイピング情報取得部である、ニュースラベリングサーバ。
【請求項5】
請求項1に記載のニュースラベリングサーバにおいて、
前記マスキング処理は、前記企業名を異なる文字列に変換する処理である、ニュースラベリングサーバ。
【請求項6】
請求項1に記載のニュースラベリングサーバにおいて、
前記AIモデルは、自然言語処理技術(例えば、BERT)を用いる、ニュースラベリングサーバ。
【請求項7】
請求項1に記載のニュースラベリングサーバにおいて、
前記ニュースラベリングサーバは、前記AI処理済みニュース情報を、
端末装置に送信する、ニュースラベリングサーバ。
【請求項8】
請求項1に記載のニュースラベリングサーバにおいて、
前記
複数のラベル又は分類は、環境問題(例えば、気候変動問題等)への配慮及び/又は社会課題への取り組みに関するラベルA、並びに所定の肯定的用語(例えば、持続可能な開発目標(SDGs)関連)に関するラベルBを少なくとも含む、ニュースラベリングサーバ。
【請求項9】
請求項1~8のいずれか一項に記載のニュースラベリングサーバと、前記ニュースラベリングサーバから前記AI処理済みニュース情報を受信する端末装置とから構成される、ニュースラベリングシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ニュース情報をラベリングするニュースラベリングシステム及びニュースラベリングサーバに関する。
【背景技術】
【0002】
国内外のマーケットを対象とした市場運用業務において、投資の意思決定などにあたり多種多様な情報の収集及び分析を分析担当者が人手で行っていた。しかしながら、複数の情報ソースが配信する大量のビジネス関連情報の中から、投資判断に影響を与え得る各種情報(ネガティブニュース、官公庁又は企業のネガティブな発表等)を抽出し、短時間で分析・吟味していた。
【0003】
例えば、収集される情報ソースは、国内外の、ニュース記事、企業発信情報、及び官公庁又は公的機関の発表等(以下、「ニュース情報」という)である。分析担当者は、ニュース情報から企業名やキーワード等で検索して必要なニュース情報を抽出し、読み込んで重要なニュース情報か否かを判断していた。
【0004】
一方、特許文献1には、単語埋め込みプロセスに基づく機械学習手段によってテキストを分類し、モデレートする(単語を隠す)技術およびシステムが開示されている(要約書、請求項1)。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述した市場運用業務において、投資判断に影響を与え得るニュース情報を抽出し、短時間で分析・吟味するには、分析担当者に相応の知見と時間を要するため、業務堅確性と効率性の観点で課題となっていた。
【0007】
なお、特許文献1のシステムは、特定のコメントのテキストが、クライアントマシンのディスプレイ上のテキストを隠される(請求項1)ため、担当者がニュース記事を判断することできない。
【0008】
そこで、本発明は、投資判断に影響を与え得るニュース情報を分析担当者等の人手を介さずに複数のラベルにラベリング可能なニュースラベリングシステム及びニュースラベリングサーバを提供する。
【課題を解決するための手段】
【0009】
本発明の各態様例は次の通りである。
[態様例1]
投資に関するニュースを含む複数のニュース情報をラべリング又は分類するニュースラベリングサーバであって、
前記ニュースラベリングサーバは、前記ニュース情報を取得する情報取得部と、前記情報取得部により取得された前記ニュース情報を記憶する取得情報データベースと、前記ニュース情報を前記取得情報データベースから読出してAIモデルを用いて処理するAI処理部と、AI処理部により処理されたAI処理済みニュース情報を記憶するAI処理情報データベースとを備え、
前記AI処理部は、前記ニュース情報を複数のラベル又は分類にラべリング又は分類する処理と、前記複数のラベル又は分類ごとに、前記ニュース情報をスコアリングする処理とを実行する、ニュースラベリングサーバ。
【0010】
[態様例2]
態様例1に記載のニュースラベリングサーバにおいて、
前記ニュース情報は、投資に関するネガティブ情報を含む、ニュースラベリングサーバ。
[態様例3]
態様例1に記載のニュースラベリングサーバにおいて、
前記複数のラべリング又は分類は、AML(アンチマネーロンダリング)又は経済制裁に関するラベルA、投資又は経済活動に関するラベルB、及び所定の用語(例えば、ネガティブワード)に関するラベルCを少なくとも含む、ニュースラベリングサーバ。
[態様例4]
態様例1に記載のニュースラベリングサーバにおいて、
前記情報取得部は、APIを用いて外部装置から前記ニュース情報を取得するAPI情報取得部、及び/又はウェブスクレイピングを用いて前記ニュース情報を取得するスクレイピング情報取得部である、ニュースラベリングサーバ。
【0011】
[態様例5]
態様例1に記載のニュースラベリングサーバにおいて、
前記ニュースラベリングサーバの制御部又は前記AI処理部が、前記ニュース情報に含まれる企業名に対するマスキング処理を実行した後、前記AI処理部が、前記ラべリング又は分類する処理を実行する、ニュースラベリングサーバ。
[態様例6]
態様例1に記載のニュースラベリングサーバにおいて、
前記AIモデルは、自然言語処理技術(例えば、BERT)を用いる、ニュースラベリングサーバ。
[態様例7]
態様例1に記載のニュースラベリングサーバにおいて、
前記ニュースラベリングサーバは、前記AI処理済みニュース情報を、前記端末装置に送信する、ニュースラベリングサーバ。
[態様例8]
態様例1に記載のニュースラベリングサーバにおいて、
前記複数のラべリング又は分類は、環境問題(例えば、気候変動問題等)への配慮及び/又は社会課題への取り組みに関するラベルA、並びに所定の肯定的用語(例えば、持続可能な開発目標(SDGs)関連)に関するラベルBを少なくとも含む、ニュースラベリングサーバ。
[態様例9]
態様例1~8のいずれか一項に記載のニュースラベリングサーバと、前記ニュースラベリングサーバから前記AI処理済みニュース情報を受信する端末装置とから構成される、ニュースラベリングシステム。
【発明の効果】
【0012】
本発明のニュースラベリングシステム、及びニュースラベリングサーバは、投資判断に影響を与え得るニュース情報を分析担当者等の人手を介さずに、AIを用いて複数のラベルにラベリングするとともに、ラベリングしたニュース情報をスコアリングすることができる。
【図面の簡単な説明】
【0013】
【
図1】本発明の実施形態に係るニュースラベリングシステムを含むネットワーク図である。
【
図2】
図1のニュースラベリングサーバを示すブロック図である。
【
図4】
図1のニュースラベリングシステムが実行するフローチャートである。
【
図5】
図1の端末装置に表示される検索画面の図である。
【
図6】
図1の端末装置に表示される詳細画面の図である。
【発明を実施するための形態】
【0014】
本発明のニュースラベリングシステム、及びニュースラベリングサーバに関する実施形態を、図面を参照して説明する。本発明においてラベリング(分類)されるニュース情報は、「ネガティブニュース」に限定されず投資判断に影響を与える任意の情報を含む。本発明の実施形態に係るニュースラベリングサーバは、1つのサーバに限定されず、複数のサーバ又はクラウドサーバから構成されてもよい。
【0015】
[ニュースラベリングシステム]
本発明の実施形態に係るニュースラベリングシステム1000は、
図1のブロック図に示すように構成される。ニュースラベリングシステム1000は、ニュースラベリングサーバ200と、ニュースラベリングサーバ200にインターネット300等の通信回線を介して接続される複数の端末装置400(400A,400B)とから構成される。端末装置400は、好ましくは、スマートフォン400A、パーソナルコンピュータ400B、またはタブレット端末とすることができる。なお、インターネット300には、投資判断に影響を与えるニュース情報を提供するニュース情報サーバ500、投資判断に影響を与えるニュース情報を提供する官公庁又は公的機関の官公庁情報サーバ600が通信可能に接続されている。
【0016】
次に、ニュースラベリングシステム1000に含まれるニュースラベリングサーバ200の構成を
図2を用いて説明する。ニュースラベリングサーバ200は、外部装置と通信するための通信部210と、API(Application Programming Interface)を用いて外部装置からニュース情報を取得(データ連携)するAPI情報取得部220と、ウェブスクレイピングを用いて自動的に外部装置からニュース情報を取得するスクレイピング情報取得部230と、AI(人工知能)を用いて外部装置から取得した情報を処理するAI処理部(ニュースラベリングAI)240とを備える。
【0017】
外部装置は、例えば、端末装置400、ニュース情報サーバ500、又は官公庁情報サーバ600とすることができる。API情報取得部220は、少なくとも1つのニュース情報サーバ500から所定の条件に基づきニュース情報を取得する。スクレイピング情報取得部230は、少なくとも1つの官公庁情報サーバ600から所定の条件に基づきニュース情報をスクレイピング(抽出)する。
【0018】
ニュースラベリングサーバ200は、さらに、API情報取得部220及びスクレイピング情報取得部230が取得したニュース情報を記憶する取得情報データベース250と、AI処理部240が処理したAI処理情報を記憶するAI処理情報データベース260と、各部の設定やAI処理部等の各部に調整値等を入力する入力部270と、各部の動作を制御する制御部280と、各部の間でデータを伝送するデータバス290とを備えている。なお、API情報取得部220、スクレイピング情報取得部230、AI処理部240は、CPU又はGPU等から構成することができる。
【0019】
端末装置400は、
図3に示すように、ニュースラベリングサーバ200と通信するための通信部410と、ニュースラベリングサーバ200から送信されたAI処理情報を表示する表示部420(ディスプレイ)と、ユーザによる各種操作入力を受け付ける入力部440と、各部の動作を制御する制御部450(CPU等)とを備える。
【0020】
API情報取得部220及び/又はスクレイピング情報取得部230は、各ラベル毎に予め設定された所定の用語(ネガティブワード、又はブラックワード)をキーとして情報を収集する。
【0021】
[AI処理部]
AI処理部(ニュースラベリングAI)240は、AIモデルを用いて、取得情報データベース250に記憶されているニュース情報に対して、当該ニュース情報が有する特有な文脈及び用語を有することを判定する。この判定に基づき、AI処理部240は、所定の複数のラベル(分類)毎に、各ニュース情報に対してスコアを生成する。なお、スコアは0~1の範囲で付され、各ラベルにおいてスコアが大きいほど優先度(重要度)が高いことを意味する。
【0022】
所定の複数のラベル(分類)は、例えば、AML(アンチマネーロンダリング)又は経済制裁に関するラベルA、投資又は経済活動に関するラベルB、所定の用語(例えば、ネガティブワード)を含むその他のラベルCとすることができる。例えば、AI処理部240は、AIモデルを用いて、あるニュース情報に対して、ラベルAを0.68、ラベルBを0.21、ラベルCを0.11とスコアリングすることができる。この場合、AIモデルは、あるニュース情報を、最も高いスコアであるラベルAとしてラベリング(分類)する。なお、各ラベル間にも優先順位があり、ラベルC、ラベルB、ラベルAの順で優先順位が高くなる。優先順位が高いラベルはユーザに優先的に表示される。
【0023】
AIモデルは、ニュース情報中の文章データに対して、自然言語処理技術を用いて、各ラベル毎にスコアリング(優先順位付け)を実行する。自然言語処理技術は、好ましくは、Googleが提供するBERT(Bidirectional Encoder Representations from Transformers)という概念上の意味合いを理解する機械学習モデルを用いることができる。
【0024】
本実施形態のAIモデル(機械学習モデル)は、課題に合わせたファインチューニングと、時間の推移とともに劣化するモデルの精度を向上するために、人間参加型のAIシステム(HITL:Human In The Loop)とすることができる。HITLとは、機械学習のデータ処理プロセスの中に人的なオペレーションを介在させる方式である。HITLの中の人的なオペレーションとは、日々の調査業務の中で偶然発見された機械ラベリングのエラーを正しいラベリングの修正データでフィードバックすることである。
【0025】
AIモデルは、各記事にラベルA~Cを付した予測ラベルを出力するが、修正データに基づき分析担当者によって修正された修正ラベルも予測ラベルと対になって付すこともできる。修正データを機械学習の中に定期的・継続的に取り込むことで、長期にわたってAIモデルの精度を高いレベルで維持することができる。
【0026】
[情報データセット]
AI処理前のニュース情報を構成するニュースデータセットを表1に示す。表1には、ラベリング及びスコアリング(優先順位付け)等に重要な属性項目が含まれている。
【0027】
【0028】
表1において、「プロバイダー」とは、データの取得先のことで、ニュースベンダー(ニュース情報サーバ500)が提供する情報か、米当局のウェブサイト(官公庁サーバ600)から取得した情報かを表す。また、「ダイジェストニュースフラグ」とは、個別ニュースのタイトルを複数集めた要約メインの記事であるダイジェストニュースを非表示にするためのフラグをいう。なお、ニュースデータは、元言語の英語に加え、GUI上の自動翻訳による日本語訳も併せて保存している。これによって、同一記事を複数回翻訳することによるコスト増を抑えることができる。
AI処理後のニュースAIデータセット(AI処理済みニュース情報)を表2に示す。
【0029】
【0030】
表2に示すように、一つのニュース情報に対して、「AML・経済制裁記事」を示すラベルA、「投資・経済活動記事」を示すラベルB、「その他記事」を示すラベルCから構成される、3つのラベルについて、それぞれスコアが登録される。優先度が高いラベルAを有するニュース情報がニュース一覧ページ(
図5)に表示される。記事詳細ページ(
図6)では確認のため、3つのラベルスコアが表示される。
【0031】
[固有名詞のマスキング]
BERTは文脈を理解する技術として、これまでの自然言語処理技術の機械学習よりも優れている。しかしながら、それでも同一企業で同一ラベルが適用され続けると、文脈の内容よりも、企業名だけでラベルを判断しがちになる。具体的な例を挙げると、中国と米国の貿易摩擦でファーウェイが制裁の対象となるということがあった。こうしたニュース記事は、主に「AML及び経済制裁記事」であるラベルAとラベリングされる。こうしたニュース記事を短期間のうちに集中して学習すると、「その他記事」としてラベルCでラベリングすべき記事内容(例えばファーウェイの新製品に関する記事)であったとしても、「ファーウェイ」という企業名があるだけで、ラベルAが付与される傾向が強くなるという過学習が生じる可能性が高くなる。
【0032】
そこで、このような過学習によって特定のワードが強い意味を帯びないように、AI処理部240でニュース記事(ニュース情報)のラベリング及びスコアリング処理を実行する前に、ニュース記事内の企業名に対してマスキング処理を実行し、企業名をラベリング及び/又はスコアリングのパラメータとして認識させないようにした。なお、企業名のマスキング処理とは、例えば、企業名を異なる文字列に置換する処理であり、制御部280又はAI処理部240によって実行される。
【0033】
[固有名詞の分類]
記事の中の企業名が地名と同じというケースはしばしば起こる。例えば、トヨタ自動車と愛知県の豊田市は日本語の場合、カタカナと漢字で区別可能ですが、英語の場合は、地名と会社名がTOYOTAと同一で表記されるため、どちらの役割で使用された名詞なのか文字からは判定できない。英語ニュースであればこういった事象は日本語以上に頻繁に起こり、例えば地名であるCalifornia州のOrange County(オレンジ郡)とフランスの通信会社ORANGE、またはフルーツとしてのOrangeは見た目上はどれも区別がつけられない。こうした問題に対処するため、文脈上の名詞の役割パターンを特定するエンティティーリンキングという方法を用いた。エンティティーリンキングは、文章中に含まれる固有名詞を抽出し、それに人名や日付や時間表現といったあらかじめ定義された分類と対応づける方法である。エンティティーリンキングを使用すると、固有名詞に対して意味上での役割とワードが同時に付される。例えば、OrangeはCaliforniaという州名とCountry(群)という区域を表す単語に挟まっており、このような使用形態ではOrangeはCityの意味で文脈上認識されているため、Orangeという企業に関する情報ではないことが分かる。
【0034】
[タグ情報の活用]
ニュースベンダーから提供を受けているニュース記事は、ジャンルを意味するタグがあらかじめ付与されており、このタグ情報をラベリングに活用した。過去の記事に付与したラベルとタグの関連性をTFIDF(Term Frequency - Inverse Document Frequency)指標を用いて計算すると、それぞれのラベルで使用されているタグタイプに特徴的な違いが生じる。なお、TFIDF指標とは、単語の重要度を測る指標であり、出現頻度が低い単語が同一文書内で比較的多く確認された場合TF-IDF値が高くなる。例えば、ラベルAではTF-IDF値の中で特に高い値を示したのは犯罪や司法・裁判に関するタグであった。このような統計結果を基に、タグ情報とラベリング種類の親和性と、文脈から判定したラベリング確信度の両面から正しいラベリングを判断するようにAIモデルを設定した。
【0035】
[フローチャート]
本実施形態のニュースラベリングシステム1000が実行するフローチャートの一例を
図4を参照して説明する。
【0036】
ステップS401で、ニュースラベリングサーバ200のAPI情報取得部220は、外部装置(例えば、ニュース情報サーバ500からAPIを介して、ニュース情報を取得して取得情報データベース250に記憶する。ステップS402で、スクレイピング情報取得部230は、外部装置(例えば、官公庁サーバ600のウェブサイト)からウェブスクレイピングを用いて記事又は発表等のニュース情報を取得して取得情報データベース250に記憶する。
【0037】
ステップS403で、ニュースラベリングサーバ200の制御部280は、ステップS401のニュース情報及びステップS402の情報の取得から所定期間が経過したか否かを判定する。所定期間は、好ましくは2時間から3日の範囲とすることができる。所定期間は、より好ましくは12時間又は1日とすることができる。所定期間が経過していない場合は、ステップS403を繰り返す。所定期間が経過した場合、ステップS404に移行する。
【0038】
ステップS404において、ニュースラベリングサーバ200の制御部280は、所定期間内に取得情報データベース250に蓄積された全てのニュース情報について、予め指定した固有名詞に対するマスキング処理を実行する。
【0039】
ステップS405において、ニュースラベリングサーバ200のAI処理部240は、マスキング処理されたニュース情報のそれぞれに対して、AIモデルを用いて各ラベルA~Cに対してスコアを生成し、スコアが最も高いラベルをそのニュース情報のラベルとしてラベリングする。
【0040】
ステップS406において、ニュースラベリングサーバ200のAI処理部240は、ニュース情報と、付されたラベル(例えばラベルA)と、各ラベルA~Cのスコアとから構成されるAI処理情報を、AI処理情報データベース280に登録する。
【0041】
ステップS407において、ニュースラベリングサーバ200の制御部280は、端末装置400からニュース情報に対してAI処理情報の検索及び出力に関するコマンドを受信したか否かを判定する。このコマンドを受信しない場合、ステップS403に戻る。のコマンドを受信した場合、ステップS408に移行する。
【0042】
ステップS408において、ニュースラベリングサーバ200の制御部280は、端末装置400が指定した条件で、AI処理情報を検索して、検索結果を端末装置400に送信する。端末装置400は、受信したAI処理情報の検索結果を、
図5及び6に示すように、表示部(ディスプレイ)420に表示する。
【0043】
[端末装置に表示される画面]
端末装置400の表示部に表示される画面例を
図5、6を参照して説明する。
図5には、ユーザが予め指定した条件に基づき、関連するニュース情報が表示されている。ユーザが予め指定した条件とは、検索期間、検索ワード(未入力)、対象企業マスタ選択(社債ユニバース)、モデル選択(ネガティブニュース)、キーワードマスタ選択(経済制裁DD)、お気に入り検索(未入力)となっている。この条件で検索されたニュース記事一覧が
図5に表示されている。
図5に表示されるニュース記事は、ラベルAのスコアが高い順に常時されており、各記事について、スコア順位、更新日時、タイトル、該当企業、主語企業、キーワード、予測ラベル等が表示される。
【0044】
図5のニュース記事一覧において、白色破線で囲んだ部分の記事をユーザが端末装置400の入力部440を用いて選択すると、
図6に示すように記事詳細が表示される。記事詳細には、記事題名と、AIによる予測ラベル(ラベルA)が表示され、各ラベルのスコア(ラベルAのスコアが0.98、ラベルBのスコアが0.01、ラベルCのスコアが0.01)が表示されている。補正ラベルが入力されている場合は、補正ラベルが表示される。該当企業名、主語企業名、選択されたキーワード、記事本文が表示される。
【0045】
ニュース記事(ニュース情報)を検索する際に、あらかじめ設定していた企業名やキーワードにヒットした場合は、その該当箇所をニュース情報ごとに保存し(該当企業・キーワード項目)、記事にヒットした単語を記事詳細ページ(
図6)の中で該当箇所を他の箇所と異なる色(例えば赤色)で表示する。また、分析担当者はニュース記事ごとにコメントを作成することができ、利用者全体でラベルの変更理由などを共有できるプラットフォームとして利用することができる。
【0046】
本発明の実施形態において、所定の複数のラベル(分類)は、ネガティブニュースに関する、AML又は経済制裁に関するラベルA、投資又は経済活動に関するラベルB、所定の用語(例えば、ネガティブワード)を含むその他のラベルCとした。これに対して、本発明の第1の変形例において、所定の複数のラベルは、ポジティブニュースに関する、環境問題(例えば、気候変動問題等)への配慮及び/又は社会課題への取り組みに関するラベルA、並びに所定の肯定的用語(例えば、持続可能な開発目標(SDGs)関連)に関するラベルBとすることができる。本発明の第2の変形例において、所定の複数のラベルは、SDGs関連(例えば、SDGsの17の目標の、1つ又は任意の複数の組合せ)に近しい文脈のニュース記事をAI処理部がスコアリングし、一定閾値以上のものをラベルA、それ以外はラベルBとすることができる。
【0047】
SDGsの17の目標は、「1 貧困をなくそう」、「2 飢餓をゼロに」、「3 すべての人に健康と福祉を」、「4 質の高い教育をみんなに」、「5 ジェンダー平等を実現しよう」、「6 安全な水とトイレを世界中に」、「7 エネルギーをみんなに、そしてクリーンに」、「8 働きがいも経済成長も」、「9 産業と技術革新の基盤をつくろう」、「10 人や国の不平等をなくそう」、「11 住み続けられるまちづくりを」、「12 つくる責任 つかう責任」、「13 気候変動に具体的な対策を」、「14 海の豊かさを守ろう」、「15 陸の豊かさも守ろう」、「16 平和と公正をすべての人に」、及び「17 パートナーシップで目標を達成しよう」である。
【符号の説明】
【0048】
1000 ニュースラベリングシステム
200 ニュースラベリングサーバ
210 通信部
220 API情報取得部
230 スクレイピング情報取得部
240 AI処理部
250 取得情報データベース
260 AI処理情報データベース
270 入力部
280 データバス
300 インターネット
400 端末装置
500 ニュース情報サーバ
600 官公庁情報サーバ
【要約】
【課題】 投資判断に影響を与えるニュース情報を人手を介さずにラベリング又は分類することができるニュースラベリングシステム及びニュースラベリングサーバを提供する。
【解決手段】 ニュースラベリングシステム1000は、投資に関するニュース情報をラべリングするニュースラベリングサーバ200と、端末装置400とから構成される。ニュースラベリングサーバ200は、ニュース情報を取得する情報取得部220、230と、情報取得部220、230により取得されたニュース情報を記憶する取得情報DB250と、テキスト情報を取得情報DBから読出してAIモデルを用いて処理するAI処理部240と、AI処理部240により処理されたAI処理済みテキスト情報を記憶するAI処理情報データベース260とを備える。AI処理部240は、ニュース情報を複数のラベルにラべリングする処理と、ニュース情報をラベルごとにスコアリングする処理とを実行する。
【選択図】
図2