IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 國立成功大學の特許一覧

特開2023-174429ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム
<>
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図1
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図2
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図3
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図4
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図5
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図6
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図7
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図8
  • 特開-ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023174429
(43)【公開日】2023-12-07
(54)【発明の名称】ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステム
(51)【国際特許分類】
   G06F 16/36 20190101AFI20231130BHJP
   G06F 16/35 20190101ALI20231130BHJP
【FI】
G06F16/36
G06F16/35
【審査請求】有
【請求項の数】18
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022101329
(22)【出願日】2022-06-23
(31)【優先権主張番号】111119394
(32)【優先日】2022-05-25
(33)【優先権主張国・地域又は機関】TW
(71)【出願人】
【識別番号】502250743
【氏名又は名称】國立成功大學
【氏名又は名称原語表記】NATIONAL CHENG KUNG UNIVERSITY
(74)【代理人】
【識別番号】110000408
【氏名又は名称】弁理士法人高橋・林アンドパートナーズ
(72)【発明者】
【氏名】ウェン-シャン ル
(72)【発明者】
【氏名】チェン-ウェイ リン
(72)【発明者】
【氏名】ボ ヤン ファン
(72)【発明者】
【氏名】チア-ミン トン
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FA03
5B175KA12
(57)【要約】      (修正有)
【課題】チャットボットに適用可能なナレッジグラフの構築方法及びシステムを提供する。
【解決手段】ナレッジグラフの構築方法は、ニュース記事をサブイベントに関連付けられたメインイベントに分類すること、メインイベントをナレッジグラフの第1ノードとして、サブイベントをナレッジグラフの第2ノードとしてそれぞれ使用すること、第2ノードを第1ノードに接続すること、テンプレートに従って、ニュース記事からイベントサマリーを抽出すること、イベントサマリーをナレッジグラフの複数の第3ノードとして使用し、イベントサマリーとサブイベントとの関連付けに従って、第3ノードのそれぞれを第2ノードのうちの1つに接続すること、イベントサマリーからコメンターアイデンティティを抽出すること、コメンターアイデンティティをナレッジグラフの複数の第4ノードとして使用し、第4ノードの各々を第3ノードの1つに接続すること、を含む。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数のニュース記事を複数のサブイベントに関連付けられたメインイベントに分類すること、
前記メインイベントを前記ナレッジグラフの第1ノードとして使用すること、
前記サブイベントを前記ナレッジグラフの複数の第2ノードとしてそれぞれ使用すること、
前記第2ノードを前記第1ノードに接続すること、
テンプレートに従って、前記ニュース記事から複数のイベントサマリーをそれぞれ抽出すること、
前記イベントサマリーを前記ナレッジグラフの複数の第3ノードとしてそれぞれ使用し、前記イベントサマリーと前記サブイベントとの関連付けに従って、前記第3ノードのそれぞれを前記第2ノードのうちの1つに接続すること、
前記イベントサマリーから複数のコメンターアイデンティティを抽出すること、及び
前記コメンターアイデンティティを前記ナレッジグラフの複数の第4ノードとして使用し、前記第4ノードの各々を前記第3ノードの1つに接続すること、
を含む、処理装置によって実行される、ナレッジグラフの構築方法。
【請求項2】
前記イベントサマリーから前記コメンターアイデンティティを抽出することは、
前記イベントサマリーから複数のコメンター名を抽出すること、
前記コメンター名に基づいて、前記コメンター名の複数のコメンター職業をドメイン特定データベースから検索すること、
前記コメンター職業と前記メインイベントとの間の複数の接続に従って、前記コメンター名にそれぞれ複数の重み付けを割り当てること、及び
前記コメンターアイデンティティの一つを、前記コメンター名の一つと前記重み付けのうちの対応する重み付けとで構成すること、
を含み、
前記接続及び前記重み付けは、正の相関を有する、請求項1に記載のナレッジグラフの構築方法。
【請求項3】
前記イベントサマリーから前記コメンターアイデンティティを抽出することは、
前記イベントサマリーから、コメント時間の複数の断片及び複数のニュースウェブサイトアドレスを抽出すること、及び
前記コメンターアイデンティティの一つを、前記コメンター名の一つ、前記コメント時間の断片のうちの対応するコメント時間、および前記ニュースウェブサイトアドレスのうちの対応するニュースウェブサイトアドレスで構成すること、
をさらに含む、請求項2に記載のナレッジグラフの構築方法。
【請求項4】
ユーザ質問を解析し、ターゲット質問を取得すること、
請求項1に記載のナレッジグラフの構築方法から生成された複数のニュースナレッジグラフから、前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、
前記ターゲットイベントナレッジグラフのサブイベントから、前記ターゲット質問にマッチするターゲットサブイベントを決定すること、
前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力すること、
を含む、処理装置によって実行されるニュースイベントの会話方法。
【請求項5】
前記ターゲットサマリーは、複数のターゲットサマリーであり、
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力することは、
前記ターゲットサマリーを接続するそれぞれのコメンターアイデンティティに対応する重み付けに従って、前記ターゲットサマリーをソートすること、
前記コメンターアイデンティティと対応するターゲットサマリーのそれぞれとに従って、複数のサブ回答を生成すること、及び
前記ターゲットサマリーのソート結果に従って、前記サブ回答を前記完全な回答としてソートすること、
を含む、請求項4に記載のニュースイベントの会話方法。
【請求項6】
ユーザ質問を解析し、ターゲット質問を取得すること、
請求項2に記載のナレッジグラフの構築方法から生成された複数のニュースナレッジグラフから、前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、
前記ターゲットイベントナレッジグラフのサブイベントから、前記ターゲット質問にマッチするターゲットサブイベントを決定すること、
前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び
前記ターゲットサマリー及び前記ターゲットサマリーに対応する1つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力すること、
を含む、処理装置によって実行されるニュースイベントの会話方法。
【請求項7】
前記ターゲットサマリーは、複数のターゲットサマリーであり、
前記ターゲットサマリー及び前記ターゲットサマリーに対応する1つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力することは、
前記ターゲットサマリーを接続するそれぞれのコメンターアイデンティティに対応する重み付けに従って前記ターゲットサマリーをソートすること、
前記コメンターアイデンティティ及び対応するターゲットサマリーのそれぞれに従って、複数のサブ回答を生成すること、及び
前記ターゲットサマリーのソート結果に従って、前記サブ回答を前記完全な回答としてソートすること、
を含む、請求項6に記載のニュースイベントの会話方法。
【請求項8】
ユーザ質問を解析し、ターゲット質問を取得すること、
請求項3に記載のナレッジグラフの構築方法から生成された複数のニュースナレッジグラフから、前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、
前記ターゲットイベントナレッジグラフのサブイベントから、前記ターゲット質問にマッチするターゲットサブイベントを決定すること、
前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び
前記ターゲットサマリー及び前記ターゲットサマリーに対応する1つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力すること、
を含む、処理装置によって実行されるニュースイベントの会話方法。
【請求項9】
前記ターゲットサマリーは、複数のターゲットサマリーであり、
前記ターゲットサマリー及び前記ターゲットサマリーに対応する1つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力することは、
前記ターゲットサマリーを接続するそれぞれのコメンターアイデンティティに対応する重み付けに従って前記ターゲットサマリーをソートすること、
前記コメンターアイデンティティ及び対応するターゲットサマリーのそれぞれに従って、複数のサブ回答を生成すること、及び
前記ターゲットサマリーのソート結果に従って、前記サブ回答を前記完全な回答としてソートすること、
を含む、請求項8に記載のニュースイベントの会話方法。
【請求項10】
メインイベントと複数のサブイベントとを記憶し、前記メインイベントが複数のサブイベントと関連付けられている、メモリと、
前記メモリに接続された処理装置と、
を含み、
前記処理装置は、
複数のニュース記事を前記メインイベントに分類すること、
前記メインイベントをナレッジグラフの第1ノードとして使用すること、
前記サブイベントを前記ナレッジグラフの複数の第2ノードとしてそれぞれ使用すること、
前記第2ノードを前記第1ノードに接続すること、
テンプレートに従って、前記ニュース記事から複数のイベントサマリーをそれぞれ抽出すること、
前記イベントサマリーを前記ナレッジグラフの複数の第3ノードとしてそれぞれ使用し、前記イベントサマリーと前記サブイベントとの関連付けに従って、前記第3ノードのそれぞれを前記第2ノードのうちの1つに接続すること、
前記イベントサマリーから複数のコメンターアイデンティティを抽出すること、及び
前記コメンターアイデンティティを前記ナレッジグラフの複数の第4ノードとして使用し、前記第4ノードの各々を前記第3ノードの1つに接続すること、
を実行するように構成された、ナレッジグラフを構築するシステム。
【請求項11】
前記処理装置は、ドメイン特定データベースに接続され、
前記イベントサマリーからコメンターアイデンティティを抽出することを実行するように構成された前記処理装置は、
前記イベントサマリーから複数のコメンター名を抽出すること、
前記コメンター名に基づいて、前記コメンター名の複数のコメンター職業を前記ドメイン特定データベースから検索すること、
前記コメンター職業と前記メインイベントとの間の複数の接続に従って、前記コメンター名にそれぞれ複数の重み付けを割り当てること、及び
前記コメンターアイデンティティの一つを、前記コメンター名の一つと前記重み付けのうちの対応する重み付けとで構成すること、
を含み、
前記接続及び前記重み付けは、正の相関を有する、請求項10に記載のナレッジグラフを構築するシステム。
【請求項12】
前記イベントサマリーからコメンターアイデンティティを抽出することを実行するように構成された前記処理装置は、
前記イベントサマリーから、コメント時間の複数の断片及び複数のニュースウェブサイトアドレスを抽出すること、及び
前記コメンターアイデンティティの一つを、前記コメンター名の一つ、前記コメント時間の断片のうちの対応するコメント時間、および前記ニュースウェブサイトアドレスのうちの対応するニュースウェブサイトアドレスで構成すること、
をさらに含む、請求項11に記載のナレッジグラフを構築するシステム。
【請求項13】
ユーザ質問を受信するように構成されたユーザインターフェースと、
請求項1に記載のナレッジグラフの構築方法から生成された複数のニュースイベントナレッジグラフを記憶するメモリと、
前記ユーザインターフェース及び前記メモリに接続された処理装置と、
を含み、
前記処理装置は、
ユーザ質問を解析し、ターゲット質問を取得すること、
前記ニュースナレッジグラフから、前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、
前記ターゲットイベントナレッジグラフのサブイベントから、前記ターゲット質問にマッチするターゲットサブイベントを決定すること、
前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力すること、
を実行するように構成された、ニュースイベントの会話システム。
【請求項14】
前記ターゲットサマリーは、複数のターゲットサマリーであり、
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力することを実行するように構成された処理装置は、
前記ターゲットサマリーを接続するそれぞれのコメンターアイデンティティに対応する重み付けに従って、前記ターゲットサマリーをソートすること、
前記コメンターアイデンティティと対応するターゲットサマリーのそれぞれとに従って、複数のサブ回答を生成すること、及び
前記ターゲットサマリーのソート結果に従って、前記サブ回答を前記完全な回答としてソートすること、
を含む、請求項13に記載のニュースイベントの会話システム。
【請求項15】
ユーザ質問を受信するように構成されたユーザインターフェースと、
請求項2に記載のナレッジグラフの構築方法から生成された複数のニュースイベントナレッジグラフを記憶するメモリと、
前記ユーザインターフェース及び前記メモリに接続された処理装置と、
を含み、
前記処理装置は、
ユーザ質問を解析し、ターゲット質問を取得すること、
前記ニュースナレッジグラフから、前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、
前記ターゲットイベントナレッジグラフのサブイベントから、前記ターゲット質問にマッチするターゲットサブイベントを決定すること、
前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力すること、
を実行するように構成された、ニュースイベントの会話システム。
【請求項16】
前記ターゲットサマリーは、複数のターゲットサマリーであり、
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力することを実行するように構成された処理装置は、
前記ターゲットサマリーを接続するそれぞれのコメンターアイデンティティに対応する重み付けに従って、前記ターゲットサマリーをソートすること、
前記コメンターアイデンティティと対応するターゲットサマリーのそれぞれとに従って、複数のサブ回答を生成すること、及び
前記ターゲットサマリーのソート結果に従って、前記サブ回答を前記完全な回答としてソートすること、
を含む、請求項15に記載のニュースイベントの会話システム。
【請求項17】
ユーザ質問を受信するように構成されたユーザインターフェースと、
請求項3に記載のナレッジグラフの構築方法から生成された複数のニュースイベントナレッジグラフを記憶するメモリと、
前記ユーザインターフェース及び前記メモリに接続された処理装置と、
を含み、
前記処理装置は、
ユーザ質問を解析し、ターゲット質問を取得すること、
前記ニュースナレッジグラフから、前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、
前記ターゲットイベントナレッジグラフのサブイベントから、前記ターゲット質問にマッチするターゲットサブイベントを決定すること、
前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力すること、
を実行するように構成された、ニュースイベントの会話システム。
【請求項18】
前記ターゲットサマリーは、複数のターゲットサマリーであり、
前記ターゲットサマリー及び前記ターゲットサマリーに対応する一つ以上のコメンターアイデンティティに応じて完全な回答を前記コメンターアイデンティティから出力することを実行するように構成された処理装置は、
前記ターゲットサマリーを接続するそれぞれのコメンターアイデンティティに対応する重み付けに従って、前記ターゲットサマリーをソートすること、
前記コメンターアイデンティティと対応するターゲットサマリーのそれぞれとに従って、複数のサブ回答を生成すること、及び
前記ターゲットサマリーのソート結果に従って、前記サブ回答を前記完全な回答としてソートすること、
を含む、請求項17に記載のニュースイベントの会話システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、35 U.S.C. §119(a)に基づき、2022年5月25日に中華民国(ROC)で出願された特許出願番号No(s). 111119394の優先権を主張し、その内容全体は、参照により本明細書に組み込まれる。
【0002】
本開示は、ナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステムに関し、特に、チャットボットに適用可能なナレッジグラフの構築方法及びシステムならびにニュースイベントの会話方法及びシステムに関するものである。
【背景技術】
【0003】
関連技術
情報爆発の時代、従来の新聞や雑誌に加え、インターネット上にもさまざまなメディアのニュースがあり、同じ話題でも取材対象者によって異なる情報を含んでいることがある。しかし、読者はさまざまな情報を受け取ることができるが、全ての取材対象者がインタビュー対象について専門的かつ詳細に理解しているわけではない。そのため、読者は不完全な、あるいは誤った情報を受け取る可能性がある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
したがって、本開示は、ナレッジグラフを構築する方法及びシステム、ならびにニュースイベントの会話方法及びシステムを提供する。
【課題を解決するための手段】
【0005】
本開示の一つ以上の実施形態によれば、処理装置によって実行されるナレッジグラフの構築方法は、複数の ニュース記事をメインイベントに分類し、前記メインイベントを複数のサブイベントに関連付けること、前記メインイベントを前記ナレッジグラフの第1ノードとして使用すること、前記サブイベントをそれぞれ、ナレッジグラフの複数の第2ノードとして使用すること、前記第2ノードを前記第1ノードに接続すること、テンプレートに従って、ニュース記事からそれぞれ複数のイベントサマリーを抽出すること、前記イベントサマリーをそれぞれ前記ナレッジグラフの複数の第3ノードとして使用し、前記イベントサマリーと前記サブイベントとの関連付けに従って、前記第3ノードの各々を前記第2ノードのうちの1つに接続すること、前記イベントサマリーから複数のコメンターアイデンティティ(commenter identities)を抽出すること、及び前記コメンターアイデンティティをナレッジグラフの複数の第4ノードとして使用し、前記第4ノードの各々を前記第3ノードの1つに接続すること、を含む。
【0006】
本開示の一つ以上の実施形態によれば、処理装置によって実行されるニュースイベントの会話方法は、ユーザ質問を解析して、ターゲット質問を得ること、上述のナレッジグラフの構築方法から生成された複数のニュースナレッジグラフから、前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、前記ターゲットイベントナレッジグラフのサブイベントから、前記ターゲット質問にマッチするターゲットサブイベントを決定すること、前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び前記ターゲットサマリーと前記ターゲットサマリーに対応する1つ以上のコメンターアイデンティティとに応じて完全な回答をコメンターアイデンティティから出力すること、を含む。
【0007】
本開示の1つ以上の実施形態によれば、ナレッジグラフを構築するシステムは、メモリと、前記メモリに接続された処理装置と、を含む。前記メモリは、メインイベントと複数のサブイベントを格納するように構成され、前記メインイベントは複数のサブイベントと関連付けられている。前記処理装置は、複数のニュース記事をメインイベントに分類すること、前記メインイベントを前記ナレッジグラフの第1ノードとして使用すること、前記サブイベントをそれぞれ前記ナレッジグラフの複数の第2ノードとして使用すること、前記第2ノードを前記第1ノードに接続すること、テンプレートに従って前記ニュース記事からそれぞれ複数のイベントサマリーを抽出すること、前記イベントサマリーを前記ナレッジグラフの複数の第3ノードとして使用し、前記イベントサマリーと前記サブイベントとの関連付けに従って、前記第3ノードの各々を前記第2ノードの1つに接続すること、前記イベントサマリーから複数のコメンターアイデンティティを抽出すること、及び前記コメンターアイデンティティを前記ナレッジグラフの複数の第4ノードとして使用し、前記第4ノードの各々を前記第3ノードの1つに接続すること、を実行するように構成される。
【0008】
本開示の1つ以上の実施形態によれば、ニュースイベントの会話システムは、ユーザインターフェースと、メモリと、前記ユーザインターフェース及び前記メモリに接続された処理装置と、を含む。前記ユーザインターフェースは、ユーザ質問を受け付けるように構成されている。前記メモリは、上述したナレッジグラフの構築方法から生成された複数のニュースイベントナレッジグラフを記憶する。前記処理装置は、ユーザ質問を解析して、ターゲット質問を得ること、前記ニュースナレッジグラフから前記ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、前記ターゲットイベントナレッジグラフのサブイベントから前記ターゲット質問にマッチするターゲットサブイベントを決定すること、前記ターゲットサブイベントを接続するイベントサマリーをターゲットサマリーとして使用すること、及び前記ターゲットサマリーと前記ターゲットサマリーに対応する1つ以上のコメンターアイデンティティとに応じて完全な回答をコメンターアイデンティティから出力すること、を実行するように構成される。
【発明の効果】
【0009】
以上を考慮すると、本開示の1つ以上の実施形態によるナレッジグラフの構築方法及びシステムは、構造的かつ詳細な情報を提供することができ、ナレッジグラフを使用するシステム(例えば、検索エンジン、及び本開示のニュースイベントの会話システム)は、ナレッジグラフに従って関連情報をより速く取得することができる。本開示のニュースイベントの会話方法及びシステムの1つ以上の実施形態によれば、ユーザがユーザインターフェースを介して質問を提起すると、処理装置は、質問が属する専門分野を決定し、ユーザ質問に答えるためのイベントサマリーを提供してもよい。これにより、ユーザは検索に時間をかけることなく、簡潔で適切な情報を得ることができる。
【図面の簡単な説明】
【0010】
本開示は、以下に与えられる詳細な説明および添付の図面からより完全に理解されるものであり、これらは、例示のみを目的として与えられ、したがって本開示を限定するものではない。
【0011】
図1】本開示の一実施形態に係るナレッジグラフの構築システムを示すブロック図である。
図2】本開示の一実施形態に係るナレッジグラフの構築方法を示すフローチャートである。
図3】本開示の一実施形態に係るナレッジグラフを示す例示的な図である。
図4図2のステップS17を示す詳細なフローチャートである。
図5】本開示の一実施形態に係るナレッジグラフを示す別の例示的な図である。
図6】本開示の一実施形態によるニュースイベントの会話システムを示すブロック図である。
図7】本開示の一実施形態に係るニュースイベントの会話方法を示すフローチャートである。
図8図7のステップS25を示す詳細なフローチャートである。
図9】本開示の1つ以上の実施形態に係るニュースイベントの会話方法及びシステムをチャットボットに適用することを示す模式図である。
【発明を実施するための形態】
【0012】
詳細な説明
以下の詳細な説明では、説明の目的で、開示された実施形態の完全な理解を提供するために、多くの具体的な詳細が記載されている。本願明細書に開示された説明、特許請求の範囲及び図面によれば、当業者は、本発明の概念及び特徴を容易に理解することができる。以下の実施形態は、本発明の様々な態様をさらに説明するものであるが、本発明の範囲を限定することを意図するものではない。
【0013】
図1及び図2を参照すると、図1は、本開示の一実施形態に係るナレッジグラフの構築システムを示すブロック図であり、図2は、本開示の一実施形態によるナレッジグラフの構築方法を示すフローチャートである。本開示の実施形態のナレッジグラフの構築システム1は、処理装置11とメモリ12とを含んでもよく、処理装置11は、メモリ12に電気的に接続されてもよく、メモリ12に通信接続されてもよい。処理装置11は、プロセッサ、プログラマブルロジックデバイス(PLD)又は特定用途向け集積回路(ASIC)等で実現されてもよいが、本開示はこれに限定されない。メモリ12は、不揮発性メモリ(NVM)であることが好ましく、例えば、ROM(Read Only Memory)、EEPROM(Electrically-Erasable Programmable Read Only Memory)又はフラッシュメモリ等であってもよいが、本開示はこれらに限定されるものではない。
【0014】
本開示の実施形態のナレッジグラフの構築方法は、ナレッジグラフの構築システム1によって実行されてもよく、特に、ナレッジグラフの構築システム1の処理装置11によって実行されてもよい。図2に示すように、ナレッジグラフの構築方法は、処理装置11によって実行される以下のステップ、ステップS11:複数のニュース記事をメインイベントに分類し、メインイベントを複数のサブイベントと関連付けること、ステップS12:メインイベントを、ナレッジグラフの第1ノードとして使用すること、ステップS13:サブイベントをそれぞれナレッジグラフの複数の第2ノードとして使用すること、ステップS14:第2ノードを第1ノードに接続すること、ステップS15:テンプレートにしたがって、ニュース記事から複数のイベントサマリーをそれぞれ抽出すること、ステップS16:イベントサマリーをそれぞれナレッジグラフの複数の第3ノードとして使用し、イベントサマリーとサブイベントとの関連付けに従って、第3ノードの各々を第2ノードうちの1つに接続すること、ステップS17:イベントサマリーから複数のコメンターアイデンティティを抽出すること、ステップS18:コメンターアイデンティティをナレッジグラフの複数の第4ノードとして使用し、第4ノードの各々を第3ノードのうちの1つに接続すること、を含んでもよい。本実施形態において、ステップS12とステップS13は同時に実行されてもよく、ステップS12はステップS13の後に実行されてもよく、ステップS12からステップS14はステップS11の前に実行されてもよいが、本開示はこれらに限定されない。
【0015】
以上の説明をより詳細に説明するために、図1図3を参照すると、図3は、本開示の一実施形態に係るナレッジグラフを例示する図であり、図3に示すナレッジグラフKGは、コロナウイルス疾患2019(COVID-19)に関連したニュースに基づいて例示されている。尚、メモリ12には、ステップS11で述べたメインイベント及びサブイベントが予め記憶されていてもよく、メインイベントはサブイベントに関連付けられている。具体的には、処理装置11又はメモリ12に接続された他の処理装置は、予めメインイベントとサブイベントとの関連付けを構築してもよく、メインイベントとサブイベントとの関連付けの構築方法は、メインイベントを含む複数のニュースのタイトルから複数のサブイベントを抽出するとともに、メインイベントを含むニュースの最初の段落から複数のサブイベントを抽出することを含んでもよく、ここで、サブイベントのフォーマットは、「主語-動詞」のペアであってもよく、「動詞-目的語」のペアであってもよく、主語と動詞の間の語数は、10語以下が好ましいが、本開示は、主語と動詞の間の語数を特定の数に制限するものではない。例えば、あるニュースのタイトルが「親は心配しないで!小児用ワクチン70万人分が到着、早ければ来週から接種開始」だとし、同じニュースの最初の段落に「新型コロナウイルス疾患用ワクチンの成人用と小児用400万人分を購入する契約がワクチン会社と締結された。成人用ワクチンの第1陣185万7000回分に続き、小児用ワクチンの第1陣77万7600回分も今朝到着した。」とあるとする。そして、このニュースのタイトルから抽出されるサブイベントは、「ワクチンが届いた(主語-動詞)」、「接種開始(主語-動詞)」を含んでもよく、最初の段落から抽出されるサブイベントは、「ワクチン会社と契約締結(主語-動詞)」、「ワクチンを購入(動詞-目的語)」、「ワクチンが届いた(主語-動詞)」を含んでもよい。また、ニュースから複数のサブイベントが抽出される場合があるため、サブイベントをメモリ12に格納する前に、処理装置11は、ニュースに記載された各サブイベントの頻度に応じてサブイベントをソートし、頻度閾値よりも低い頻度でニュースに記載されたサブイベントを削除してもよい。ニュースに記載されたサブイベントの頻度は、例えば、ニュースに記載されたサブイベントの回数をニュースの記事数で除算することによって求めてもよく、頻度閾値は、例えば、0.5としてもよいが、本開示は頻度閾値の実際の値を制限するものではない。
【0016】
ステップS11において、処理装置11は、ウェブクローラを通じてインターネット又はクラウドからメインイベントに関連する複数のニュース記事を取得してもよい。メインイベントが「ワクチン」であれば、サブイベントは「ブランドA製のワクチンの有効性はまだ証明されていない」、「混合ワクチン」「ティーンエイジャーは2回目の接種を控える」など、ワクチンに関連するトピックであってもよい。処理装置11は、ウェブクローラを通じて、ワクチン(メインイベント)及びワクチントピック(サブイベント)に関連するニュース記事を多数取得してもよい。具体的には、処理装置11によって取得されたニュース記事は、メインイベント及び/又はサブイベントの単語を含むタイトルの記事、記事の内容に記載されたメインイベント及び/又はサブイベントの回数が所定回数に達した記事などであってもよい。ワクチンに関連するニュース記事を決定した後、処理装置11は、ニュース記事をメインイベント「ワクチン」に分類してもよい。ステップS12、S13、S14において、処理装置11は、メインイベント「ワクチン」をナレッジグラフKGの第1ノードN1として使用し、ナレッジグラフKGの複数の第2ノードN2a、N2b、N2cとして、上記複数のサブイベントを使用し、第2ノードN2a~N2cと第1ノードN1とを接続する。尚、ここで説明する「メインイベントをナレッジグラフの第1ノードとして使用する」とは、メインイベントをナレッジグラフの第1ノードとして記憶することを意味し、後述の第2ノード、第3ノード及び第4ノードについても同様である。また、処理装置11は、まず、タイトルにメインイベントが含まれるニュース記事を複数取得し、それから、上記のようにメインイベントとサブイベントとの関連付けを構築することにより、各ニュース記事のタイトル及び最初の段落から1つ以上のサブイベントを取得してもよい。さらに、上記のようにニュース記事に記載される頻度によってサブイベントをスクリーニングした後、残されたサブイベントが既存のサブイベントに一致する場合、処理装置11は、このニュース記事に対して以下のステップを実行してもよく、残されたサブイベントが既存のサブイベントのいずれとも一致しない場合、処理装置11は、残されたサブイベントに従って、ナレッジグラフ上に新たなサブイベントを構築することができる。
【0017】
次に、ステップS15において、処理装置11は、メインイベントに分類されたニュース記事から、テンプレートに従って複数のイベントサマリーを抽出し、ここで、テンプレートは、「名前-発言/明言/指摘-コメント」であってもよく、テンプレートに従って抽出されたコメントは、イベントサマリーとして使用されてもよい。例えば、メインイベントに分類されるニュース記事の1つが「・・・ルアン-イン チャン(Luan-Yin Chang)医師は、40歳以上の成人、高齢者またはハイリスク患者は混合ワクチンを検討することができ、その有効性はAZの2回の投与よりもはるかに高くなることを指摘した」と記載している場合、処理装置11は、テンプレートに従って名前「ルアン-イン チャン」を抽出してもよく、イベントサマリーとしてその内容「40歳以上の成人、高齢者またはハイリスク患者は混合ワクチンを検討することができ、その有効性はAZの2回の投与よりもはるかに高くなる」を抽出してもよい。換言すると、この段階のイベントサマリーには、ニュース記事におけるコメンターアイデンティティとそのコメントが含まれている。
【0018】
ステップ16において、図3を例とすると、処理装置11は、イベントサマリーをそれぞれナレッジグラフKGの複数の第3ノードN3a、N3b、N3c、N3dとして使用してもよく、イベントサマリーの第3ノードN3a~N3dをサブイベントの関連する第2ノードN2a~N2cの1つに接続してもよい。ここで、前記「関連する」とは、例えば、イベントサマリーがサブイベントの正確な単語を含む、又は、サブイベントの単語の一部を含み、サブイベントの全単語における前記一部の単語の割合が所定の割合(例えば、50%)に達することを意味するが、本開示はこれに限定されない。さらに、第3ノードN3cを例にとると、第3ノードN3cのイベントサマリーは、第2ノードN2bのサブイベントの単語の一部(即ち、混合ワクチン)を含み、所定の割合に達すると、処理装置11は、第3ノードN3cのイベントサマリーが第2ノードN2bのサブイベントに関連していると判定し、第3ノードN3cを第2ノードN2bに接続させる。
【0019】
ステップS17及びS18において、処理装置11は、イベントサマリーに従って、対応するニュース記事からコメンターアイデンティティを抽出し、コメンターアイデンティティを第4ノードとして使用し、第4ノードを対応する第3ノードに接続する。以上のように、ステップS15で抽出されたイベントサマリーには、コメンターアイデンティティおよび彼/彼女のニュース記事におけるコメントが含まれており、ステップS17およびS18において、処理装置11は、さらに、イベントサマリーからコメンターアイデンティティを第4ノードとして抽出する。図3を例にとると、コメンターアイデンティティの抽出後のイベントサマリーは、図3に示すように、第3ノードN3a~N3dによって表されるイベントサマリーであり、処理装置11は、コメンターアイデンティティ(例えば、コメンターの名前)をナレッジグラフKGの第4ノードN4a、N4b、N4c、N4dとして使用してもよく、第4ノードN4a~N4dの各々と第3ノードN3a~N3dの対応する1つに接続してもよい。上述したニュース記事を例にとると、第3ノードN3cのイベントサマリーに対応するコメンターアイデンティティは「ルアン-イン チャン(Luan-Yin Chang)」であり、処理装置11は、コメンターアイデンティティ「ルアン-イン チャン」を第4ノードN4cとして使用してもよく、第4ノードN4cを第3ノードN3cに接続してもよい。従って、上記実施形態で構築されたナレッジグラフは、構造的かつ詳細な情報を提供することができ、ナレッジグラフを利用するシステム(例えば、検索エンジン)は、ナレッジグラフに応じた関連情報をより高速に取得することができる。
【0020】
また、ナレッジグラフKGを構築した後、処理装置11は、ナレッジグラフKGから第2ノードN2a~N2cのうち1つ以上を動的に削除してもよい。具体的には、処理装置11は、ウェブクローラを通じて、一定期間内(例えば、1週間、1ヶ月、3ヶ月等)に公開された第1ノードのメインイベントに関連するニュース記事の数を求めるとともに、メインイベントに関連する当該ニュース記事において第2ノードの各サブイベントが言及されているニュース記事の数を求め、第2ノードに対応するニュース記事の数を第1ノードに対応するニュース記事の数で除算して比率を求めてもよい。比率が所定の比率よりも小さい場合、処理装置11は、第2ノードだけでなく、第2ノードに接続された第3ノード及び第4ノードも削除してもよく、ここで、所定の比率は0.2であってもよいが、本開示は、所定の比率の実際の値を制限するものではない。
【0021】
コメンターアイデンティティの抽出の説明をさらに解説するために、図1および図4を参照する。ここで、図4は、図2のステップS17を示す詳細なフローチャートである。図4に示すように、図2におけるステップS17は、ステップS171:イベントサマリーから複数のコメンター名を抽出すること、ステップS172:コメンター名に基づいて、ドメイン特定データベースからコメンター名の複数のコメンター職業を検索すること、ステップS173:コメンター職業とメインイベントとのつながり(connection)の数に応じて、コメンター名にそれぞれ複数の重み付けを割り当てること、ここで、つながりと重み付けとは正の相関を有し、ステップS174:コメンターアイデンティティの1つを、コメンター名の1つと重み付けのうちの対応する重み付けとで構成すること、を含んでもよい。
【0022】
ステップS171およびS172において、処理装置11は、イベントサマリーからコメンター名を抽出し、コメンター名に対応する職業をドメイン特定データベースから検索して、検索した職業をコメンター職業として使用し、ここで、ドメイン特定データベースは、複数の名前とその名前に対応する複数の職業をそれぞれ記憶している。ドメイン特定データベースは、メモリ12内のデータベースであってもよく、ドメイン特定データベースは、Wikipediaなどの外部データベースであってもよい。上述したニュース記事を例にとると、処理装置11が抽出したコメンター名は「ルアン-イン チャン」であり、「ルアン-イン チャン」という名前に基づいてドメイン特定データベースから検索された職業には小児感染症主治医が含まれており、処理装置11は「ルアン-イン チャン」という名前に対応するコメンター職業として「小児感染症主治医」を用いてもよい。
【0023】
次に、ステップS173において、処理装置11は、コメンター職業とメインイベントとの関連性に応じて、コメンター名に対応する重み付けを付与し、ここで、コメンター職業とメインイベントとの関連性が高いほど重み付けが高くなる。処理装置11は、メインイベントに関連する職業を記録した辞書を予め記憶しておいてもよい。辞書には、メインイベントの分野における職業が記録されている。メインイベントが「ワクチン」であると仮定すると、辞書に記録されているメインイベントに関連する職業は、公的な保健所の長、小児科医、免疫学部の教授などを含んでもよい。これにより、コメンター名に対応する重み付けを割り当てる際に、処理装置11は、以下の規則に従って対応する重み付けを割り当ててもよい:コメンター職業が、辞書に記録されているメインイベントに関連する職業のいずれかと一致し、かつ、Wikipediaのページに表示されているコメンター職業が、辞書から検索した職業と一致する場合、最も高い重み付けをコメンターに割り当て、コメンター職業が、辞書に記録されているメインイベントに関連する職業のいずれかと一致するが、コメンターがウィキペディアのページを持っていない場合、2番目に高い重み付けをコメンターに割り当て、コメンター職業が、辞書に記録されているメインイベントに関連する職業のいずれとも一致しない場合、最も低い重み付けをコメンターに割り当てる。実装上、複数のコメンターが同じ重み付けを持つ場合があるが、本開示はこれに限定されない。
【0024】
また、同一の第2ノードに複数の第3ノードが接続されている場合、処理装置11は、辞書に従ってメインイベントと無関係なコメンター職業を除外し、除外されたコメンターに所定の最低重み付け(例えば、0の重み付け)を付与してもよい。したがって、処理装置11は、重み付けを付与するために、メインイベントと無関係な職業のコメンターのWikipediaページを追加で検索する必要がない場合がある。または、コメンター職業が「小児感染症主治医」であることを例とすると、処理装置11は、ウェブクローラを通じて「小児感染症」又は「小児感染症担当医」とメインイベント「ワクチン」とが共通して記事に表示されている回数を求め、当該回数を予め設定された数で除算して重み付けを求めてもよいし、或いは、処理装置11は、Google検索エンジンでメインイベント「ワクチン」と共に「小児感染症」または「小児感染症主治医」を検索してもよく、検索結果の数を予め設定された数で除算して重み付けを求めてもよい。逆に、処理装置11によって第3ノードN3cのイベントサマリーから抽出されたコメンター名が「ジョン(John)」であり、処理装置11がドメイン特定データベースから「ジョン」という名前に対応するコメンター職業が「歌手」であるという検索結果を取得した場合、「ジョン」という名前に対応する重み付けが、「小児感染症担当医」に対応する「ルアン-イン チャン」の重み付けより低くてもよい。つまり、重み付けは、彼/彼女のコメント分野でのコメンターの専門性を表している。したがって、重み付けが高いということは、彼/彼女のコメントの属する分野におけるコメンターの専門性が高く、彼/彼女のコメントはより有益であることを意味する。
【0025】
続いて、ステップS174において、処理装置11は、コメンター名を対応する重み付けと照合し、一致したコメンター名および重み付けを第4ノードのコメンターアイデンティティとして使用する。図3を例とすると、第4ノードN4cの第3コメンターアイデンティティは、第3ノードN3cのイベントサマリーのコメントを公開したコメンター名と、対応する重み付けとを含み、ここで、重み付けは、コメンター名に対応するコメンター職業と第1ノードN1のメインイベントとの間のつながりを表している。換言すると、第4ノードN4cの第3コメンターアイデンティティは、コメンター名「ルアン-イン チャン」と、コメンター名とメインイベントとの間のつながりを表す重み付けと、を含んでいる。
【0026】
上述した実施形態以外の別の実施形態では、処理装置11は、コメント時刻およびニュースウェブサイトのアドレスを有するコメンターアイデンティティをさらに構成してもよい。図5を参照すると、図5は、本開示の実施形態に係るナレッジグラフを示す別の例示的な図である。具体的には、図2のステップS15で抽出されるイベントサマリーは、コメンター名を含んでもよく、コメント時刻(即ち、ニュース記事が公開された時刻)及びニュースウェブサイトアドレス(即ち、ニュース記事が公開されたウェブサイトアドレス)をさらに含んでもよく、ニュースメディア(即ち、ニュース記事を公開したメディア名)をさらに含んでもよく、あるいは、イベントサマリーは、コメンター名、コメント時刻、ニュースウェブサイトアドレス及びニュースメディアのうち1つ以上を含んでいてもよいが、本開示はこれに限定されない。したがって、図2のステップS17において、処理装置11がイベントサマリーからコメンター名を抽出する際に、処理装置11は、さらにイベントサマリーからコメント時刻、ニュースメディア、及びニュースウェブサイトアドレスを同時に抽出し、コメンター名と対応するコメント時刻、対応するニュースメディア、及び対応するニュースウェブサイトアドレスとでコメンターアイデンティティを構成してもよい。図5を例にとると、ナレッジグラフKG’の第3ノードN3cのイベントサマリーが接続されている第4ノードN4cの第2コメンター名SN2は「ルアン-イン チャン」であり、第3ノードN3cのイベントサマリーは、ニュースサイトのアドレスが第3アドレス、コメント時刻が2021年11月18日のニュース記事から抽出されており、ニュース記事は第3ニュースメディアによって公開されたものである。処理装置11は、第4ノードN4cのコメンター名SN2として「ルアン-イン チャン」を使用し、第4ノードN4cのコメント時刻N41cとして日付「2021年11月18日」を使用し、第4ノードN4cのニュースメディアN42cとして「第3メディア」を使用し、第4ノードN4cのニュースウェブサイトアドレスN43cとしてニュース記事が掲載されている第3アドレスを使用する。図5に示すように、同じコメンター名が複数のイベントサマリーに接続されている場合があり、これは、複数の第4ノードが同じコメンター名を示すが、コメント時間、ニュース媒体、及び/またはニュースウェブサイトアドレスが異なる場合があることを意味することに留意されたい。また、同じサブイベントが複数の異なるイベントサマリーに接続されている場合があり、それぞれのイベントサマリーが接続されているコメンターアイデンティティは、互いに同じである場合もあれば、異なる場合もある。
【0027】
図6及び図7を参照すると、図6は、本開示の実施形態に係るニュースイベントの会話システムを示すブロック図であり、図7は、本開示の実施形態に係るニュースイベントの会話方法を示すフローチャートである。本開示の実施形態に係るニュースイベントの会話システム2は、処理装置21と、メモリ22と、ユーザインターフェース23とを含んでもよい。処理装置21は、メモリ22及びユーザインターフェース23と電気的に接続されてもよく、メモリ22及びユーザインターフェース23と通信接続されてもよい。処理装置21及びメモリ22は、それぞれ図1に示す処理装置11及びメモリ12と同じであってもよく、処理装置21及びメモリ22は、それぞれ図1に示す処理装置11及びメモリ12と異なっていても、同じ要素で実装されていればよいが、本開示はこれに限定されるものではない。ユーザインターフェース23は、ユーザによって入力されたコマンド(例えば、後述するユーザ質問)を受け取り、そのコマンドに対応する結果(例えば、後述する完全な回答)をユーザに提示するように構成される。ユーザインターフェース23は、例えば、マイク、スピーカ、キーボード、マウス及びスクリーンなどを含み、好ましくは、タッチスクリーンを含むが、本開示はこれに限定されない。
【0028】
本開示の実施形態に係るニュースイベントの会話システム2及びニュースイベントの会話方法は、チャットボットに適用され、ユーザが入力した質問に応じた回答を提供してもよい。本開示の実施形態に係るニュースイベントの会話方法は、ニュースイベントの会話システム2によって、特にニュースイベントの会話システム2の処理装置21によって実行されてもよい。図7に示すように、本開示の一実施形態によるニュースイベントの会話方法は、ステップS21:ユーザ質問を解析して、ターゲット質問を得ること、ステップS22:ナレッジグラフの構築方法から生成された複数のニュースナレッジグラフから、ターゲット質問にマッチするターゲットイベントナレッジグラフを決定すること、ステップS23:ターゲットイベントナレッジグラフのサブイベントから、ターゲット質問にマッチするターゲットサブイベントを決定すること、ステップS24:ターゲットサブイベントに接続するイベントサマリーをターゲットサマリーとして使用すること、ステップS25:ターゲットサマリーと、ターゲットサマリーに対応する1つ以上のコメンターアイデンティティに応じた完全な回答をコメンターアイデンティティから出力すること、を含む。
【0029】
ステップS21において、処理装置21は、ユーザインターフェース23を介してユーザ質問を受信して、ユーザ質問を解析してターゲット質問を取得してもよく、例えば、自然言語理解(NLU)によってユーザ質問を解析してターゲット質問を取得してもよい。例えば、ユーザ質問が「なぜティーンエイジャーは2回目のワクチン接種を控えるのか」である場合、処理装置21は、NLUにより「ティーンエイジャーは2回目のワクチン接種を控える」というターゲット質問を取得してもよい。あるいは、処理装置21は、ターゲット質問に所定のキーワードがあると判断し、所定のキーワードに続く文章をターゲット質問として使用してもよい。例えば、所定のキーワードは、「なぜ」、「誰が」、「いつ」、「どのように」、「どこで」等を含んでもよく、処理装置21は、「なぜティーンエイジャーは2回目のワクチン接種を控えるのか」というユーザ質問に、「なぜ」という所定のキーワードが含まれていると判断してもよく、所定のキーワードに続く文章である「ティーンエイジャーは2回目のワクチン接種を控える」をターゲット質問として用いてもよい。
【0030】
ステップS22において、処理装置21は、複数のニュースイベントナレッジグラフから、ターゲット質問と一致するターゲットイベントナレッジグラフを決定する。ここで、ニュースイベントナレッジグラフは、メモリ22に格納され、ニュースイベントナレッジグラフは、上述のナレッジグラフ構築方法およびシステムの1つ以上の実施形態から生成されたものである。ニュースイベントナレッジグラフは、「ワクチン」、「フェイスマスク」、「オリンピック」などのメインイベントなど、それぞれ異なるメインイベントに対応してもよい。処理装置21は、ターゲット質問とニュースイベントナレッジグラフの各メインイベントとを比較し、一致したニュースイベントナレッジグラフ(例えば、メインイベントを含むターゲット質問)を選択ターゲットイベントナレッジグラフとして使用してもよい。「なぜティーンエイジャーは2回目のワクチン接種を控える」というターゲット質問を例に挙げると、処理装置21は、このターゲット質問がメインイベント「ワクチン」を含むと判断し、メインイベント「ワクチン」のニュースイベントナレッジグラフを、図4に示すナレッジグラフKGのようなターゲットイベントナレッジグラフとして使用する。
【0031】
ステップS23およびS24において、処理装置21は、ターゲットイベントナレッジグラフにおける複数のサブイベントとターゲット質問とを比較して、ターゲット質問に合致するターゲットサブイベントを選択し、ターゲットサブイベントに接続されたイベントサマリーをターゲットサマリーとして使用する。ここで、処理装置21は、ターゲット質問に合致するサブイベントを選択することは、ターゲット質問が1つのサブイベントの単語を全て含むか判定すること、又は、1つのサブイベントの単語の一部を含み、当該単語の一部がターゲット質問の全ての単語のうち予め設定された割合(例えば、50%)まで占めると判定することであってもよいが、本開示はこれに限定されるものではない。図4を例にとると、処理装置21は、第2ノードN2a~N2cのサブイベントのうちターゲット質問に合致する1つを第2ノードN2cのターゲットサブイベントとして決定してもよく、第2ノードN2cのターゲットサブイベントに接続された第3ノードN3dのイベントサマリーをターゲットサマリーとして用いてもよい。
【0032】
次に、ステップS25において、処理装置21は、ターゲットサマリーおよび対応するコメンターアイデンティティに従って、ユーザインターフェース23に完全な回答を出力する。すなわち、完全な回答は、少なくともコメンターアイデンティティと彼/彼女のコメント(つまり、ターゲットサマリー)を含む。ここで、処理装置21は、自然言語生成(NLG)により完全な回答を生成してもよい。また、図4を例にとると、第3のノードN3dのターゲットサマリーは、第4のコメンターアイデンティティN4dに対応する。そのため、完全な回答は、「4番目のコメンターアイデンティティの名称:パンデミックは十分にコントロールされており、2回目の接種の心筋炎のリスクは1回目の接種の5~10倍である」であってもよい。したがって、ユーザがユーザインターフェース23を介して質問を提起すると、処理装置は、その質問がどの専門分野に属するかを判断し、ユーザ質問に答えるためのイベントサマリーを提供することができる。そのため、ユーザは検索に時間をかけることなく、簡潔で適切な情報を得ることができる。さらに、最初に複数のニュースイベントナレッジグラフからターゲット質問に一致するターゲットイベント知識グラフを決定し、次にターゲットイベントナレッジグラフのターゲットサブイベントに従って完全な回答を生成することによって、処理装置は、全てのナレッジグラフのサブイベントから一致するターゲット質問を検索せずにより速い方法でターゲット質問に一致するサブイベントを検索してもよく、処理装置が完全な回答の生成に費やす時間を有効に削減することができる。
【0033】
次に、図6及び図8を参照する。図8は、図7のステップS25を示す詳細なフローチャートである。図8に示すように、図7のステップS25は、ステップS251:ターゲットサマリーを接続するコメンターアイデンティティにそれぞれ対応する重み付けに従ってターゲットサマリーをソートすること、ステップS252:コメンターアイデンティティおよび対応するターゲットサマリーのそれぞれに従って複数のサブ回答を生成すること、ステップS253:完全な回答としてのターゲットサマリーのソート結果に従ってサブ回答をソートすることを含んでもよい。
【0034】
上記のように、コメンターアイデンティティは、コメンター名と対応する重み付けとを含んでいてもよく、1つのサブイベントは複数の異なるイベントサマリーに接続されていてもよく、それぞれのイベントサマリーに接続されているコメンターアイデンティティは、互いに同じであってもよく、互いに異なっていてもよい。図8の実施形態は、図7のステップS24で得られたターゲットサマリーが複数のターゲットサマリーである場合の実施形態を示すものである。したがって、ステップS251において、処理装置21は、ターゲットサマリーにそれぞれ接続されているコメンターアイデンティティに対応する重み付けに従って、ターゲットサマリーをソートし、ステップS252において、処理装置21は、コメンターアイデンティティと対応するターゲットサマリーを1対1の関係でマッチングして、複数のサブ回答を生成し、ステップS253において、処理装置21は、ステップS251のソート結果に従って、サブ回答をソートして、ソートされたサブ回答をユーザインターフェース23に出力する完全な回答として使用する。
【0035】
図8の実施形態をさらに詳しく説明するために、図6図8及び図9を参照する。図9は、本開示の1つ以上の実施形態によるニュースイベントの会話方法及びシステムをチャットボットに適用することを示す模式図である。ユーザインターフェース23を通じて得られたユーザ質問Qが「なぜティーンエイジャーは2回目のワクチン接種を控えるのか」であり、図7の実施形態に従ってマッチングされたターゲットサマリーが、第1のターゲットサマリー「パンデミックは十分にコントロールされており、2回目の接種の心筋炎のリスクは1回目の接種の5~10倍である」、および第2のターゲットサマリー「現在、ティーンエイジャーに適したワクチンはない」を含むと仮定すると、第1のターゲットサマリーに対応するコメンターアイデンティティは第1のコメンター名と第1の重み付けを含み、第2のターゲットサマリーに対応するコメンターアイデンティティは第2のコメンター名と第2の重み付けを含む。ここで、第1の重み付け及び第2の重み付けは、図4の実施形態に従って生成され、第1の重み付けは第2の重み付けよりも高い。したがって、ステップS251において、処理装置21は、第1重み付け及び第2重み付けに従って、第1のターゲットサマリーを第2のターゲットサマリーの前になるようにソートしてもよく、ステップS252において、処理装置21は、第1のサブ回答A1「第1のコメンター名:パンデミックは十分にコントロールされており、2回目の接種の心筋炎のリスクは1回目の接種の5~10倍である」及び第2のサブ回答A2「第2コメンター名:現在、ティーンエイジャーに適したワクチンはない」を生成してもよく、ステップS253において、処理装置21は、ステップS251のソート結果に従って、第1のサブ回答A1を第2のサブ回答A2の前になるようにソートし、ソートされた第1のサブ回答A1と第2のサブ回答A2を完全な回答Aとし、完全な回答Aをユーザインターフェース23に出力して、ユーザインターフェース23に完全な回答Aを提示させる。ユーザインターフェース23によって提示されるサブ回答は、コメンターに対応する重み付けに従ってソートされており、その重み付けは、コメンターのコメントの主題(即ち、メインイベント)に対するコメンターの専門性のレベルを示しているため、ユーザは、ソートされたサブ回答に従って後にソートされたサブ回答と比較して、前にソートされたサブ回答がより情報価値が高く正確である、と判断してもよい。
【0036】
以上のことから、本開示の1つ以上の実施形態によるナレッジグラフ構築方法及びシステムは、構造的かつ詳細な情報を提供し、ナレッジグラフを用いるシステム(例えば、検索エンジン及び本開示のニュースイベントの会話システム)は、ナレッジグラフに応じて関連情報をより高速に取得してもよい。本開示のニュースイベントの会話方法及びシステムの1つ以上の実施形態によれば、ユーザがユーザインターフェースを介して質問を提起すると、処理装置は、質問が属する専門分野を決定し、ユーザ質問に答えるためのイベントサマリーを提供してもよい。そのため、ユーザは検索に時間をかけることなく、簡潔で適切な情報を得ることができる。さらに、ユーザは、ソートされたサブ回答に従って、前にソートされたサブ回答が後ろにソートされたサブ回答よりも情報価値が高く正確であると判断してもよい。また、本開示の1つ以上の実施形態によるニュースイベントの会話方法及びシステムは、まず、複数のニュースイベントナレッジグラフからターゲット質問にマッチするターゲットイベントナレッジグラフを決定し、次に、ターゲットイベントナレッジグラフのターゲットサブイベントに従って完全な回答を生成することにより、システム(例えば、本開示の実施形態の処理装置)が、全てのナレッジグラフのサブイベントからマッチするターゲット質問を検索するのではなく、ターゲット質問にマッチするサブイベントを検索することができる。したがって、完全な回答を生成するために費やす時間を効果的に削減することができる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【外国語明細書】