(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022166260
(43)【公開日】2022-11-01
(54)【発明の名称】マルチシステムに基づくインテリジェントな質問応答方法、装置及び機器
(51)【国際特許分類】
G06F 16/90 20190101AFI20221025BHJP
【FI】
G06F16/90 100
【審査請求】有
【請求項の数】39
【出願形態】OL
【公開請求】
(21)【出願番号】P 2022131721
(22)【出願日】2022-08-22
(31)【優先権主張番号】202210201842.8
(32)【優先日】2022-03-02
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】フェン,シンウェイ
(72)【発明者】
【氏名】ティエン,メン
(72)【発明者】
【氏名】リ,フェイフェイ
(72)【発明者】
【氏名】シ,ホンジアン
(72)【発明者】
【氏名】ジアン,ウェンビン
(72)【発明者】
【氏名】ウー,シュエチェン
(72)【発明者】
【氏名】グオ,チェンヤン
(72)【発明者】
【氏名】ワン,ユ
(72)【発明者】
【氏名】サン,ユ
(72)【発明者】
【氏名】チェン,シュアイユ
(57)【要約】 (修正有)
【課題】人工知能の分野に関し、特に、知識グラフの分野に関するマルチシステムに基づくインテリジェントな質問応答方法、装置及び機器を提供する。
【解決手段】方法は、ユーザの質疑応答命令に応答し、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものであり、問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出し、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックする。
【選択図】
図2
【特許請求の範囲】
【請求項1】
マルチシステムに基づくインテリジェントな質問応答方法であって、前記方法は、
ユーザの質疑応答命令に応答するステップであって、前記質疑応答命令が問題情報を指示し、前記問題情報の問題タイプを決定するためのものであるステップと、
前記問題タイプに対応する問い合わせエンジンを決定して、前記問い合わせエンジンに基づいて前記問い合わせエンジンに対応する複数の問題分析システムを呼び出すステップと、
問題分析システムのシステム優先度に従い、前記複数の問題分析システムを順番に採用して前記問題情報を処理するプロセスでは、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定した場合、ユーザに前記答え情報をフィードバックするステップと、を含むマルチシステムに基づくインテリジェントな質問応答方法。
【請求項2】
前記複数の問題分析システムは、知識グラフシステム、推論質疑応答システム、ドキュメント質疑応答システム、及びよくある質問(FAQ)質疑応答システムを含み、
前記知識グラフシステムは、問題情報のエンティティに対応する答え情報を指示するためのものであり、
前記推論質疑応答システムは、問題情報に対応する推論テンプレートを指示するためのものであり、前記推論テンプレートが答え情報を決定するためのものであり、前記推論テンプレートには、順序関係のある複数の記入点が含まれ、前記記入点がワード特性を持つものであり、
前記ドキュメント質疑応答システムは、前記問題情報に対応する段落を指示するためのものであり、前記段落が答え情報を決定するためのものであり、
前記FAQ質疑応答システムは、前記問題情報に関連する他の問題を指示するためのものであり、前記他の問題及び前記問題情報が答え情報を決定するためのものである請求項1に記載の方法。
【請求項3】
前記現在の問題分析システムがドキュメント質疑応答システムである場合、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定するステップは、
前記ドキュメント質疑応答システムの第1のデータベースに従って、前記問題情報に対して類似性マッチングを行い、前記問題情報に対応する最適な段落を得るステップであって、前記第1のデータベースには複数のドキュメントが含まれており、前記ドキュメントには複数の段落があるステップと、
知識の集積による第1の拡張表現ERNIEモデルに従って、前記最適な段落に対して字数簡素化処理を行い、前記問題情報に対応する答えを得るステップと、を含む情報請求項2に記載の方法。
【請求項4】
前記ドキュメント質疑応答システムの第1のデータベースに従って、前記問題情報に対して類似性マッチングを行い、前記問題情報に対応する最適な段落を得るステップは、
前記ドキュメント質疑応答システムの第1のデータベースに従って、前記問題情報に対して類似性マッチングを行い、前記問題情報に類似する複数の候補段落を得るステップと、前記問題情報に対応するコアとなる要素情報を取得するステップと、
前記コアとなる要素情報及び前記候補段落に対して類似度計算を行い、最も高い類似度の候補段落を、前記問題情報に対応する最適な段落として決定するステップと、を含む請求項3に記載の方法。
【請求項5】
前記コアとなる要素情報は、ユーザ位置情報、ユーザ属性情報、ユーザが使用する端末機器の情報のうちの1つ又は複数を含む請求項4に記載の方法。
【請求項6】
前記現在の問題分析システムがFAQ質疑応答システムである場合、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定するステップは、
前記FAQ質疑応答システムの第2のデータベースに従って、前記問題情報に対して類似性マッチングを行い、前記問題情報に類似する複数の問題テキストを得るステップであって、前記第2のデータベースには複数の問題テキストが含まれているステップと、
前記問題情報、及び前記問題情報に類似する複数の問題テキストに従って、前記問題情報に対応する答え情報を決定するステップと、を含む請求項2に記載の方法。
【請求項7】
前記問題情報、及び前記問題情報に類似する複数の問題テキストに従って、前記問題情報に対応する答え情報を決定するステップは、
前記問題情報及び前記問題情報に類似する複数の問題テキストを、問題セットにおける候補問題として決定するステップであって、前記候補問題が特徴情報を有するステップと、
問題セットにおける候補問題の特徴情報を、予め設定されたニューラルネットワークモデルに入力し、最適な候補問題を得るステップと、
予め設定された、候補問題と答え情報との対応関係に従って、前記最適な候補問題に対応する答え情報を、前記問題情報に対応する答え情報として決定するステップと、を含む請求項6に記載の方法。
【請求項8】
前記方法は、さらに、
オリジナルドキュメントを取得し、前記オリジナルドキュメントに対して分割処理を行い、複数のショートテキストを得るステップと、第2のERNIEモデルに従って前記ショートテキストに対してブロック処理を行い、前記第2のデータベースの問題テキストを生成するステップと、を含み、
又は、オリジナルドキュメントを取得し、前記オリジナルドキュメントのタイトルを決定するステップと、前記タイトルを前記第2のデータベースの問題テキストとして決定するステップと、を含み、
又は、オリジナルドキュメントを取得し、前記オリジナルドキュメントに対してコンテンツ構造分析処理を行い、質問特性を持つショートスニペットを得るステップと、前記ショートスニペット及び前記ショートスニペットの前記オリジナルドキュメントにおけるオリジナル段落を、予め設定されたモデルに入力し、前記第2のデータベースの問題テキストを得るステップであって、前記ショートスニペットが得られた問題テキストに対応する答え情報であるステップと、を含む請求項6に記載の方法。
【請求項9】
前記現在の問題分析システムが知識グラフシステムである場合、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定するステップは、
前記問題情報のエンティティを抽出するステップと、
前記知識グラフシステムに予め設定された知識グラフ及び第3のERNIEモデルに従って、前記問題情報のエンティティを認識し、前記問題情報に対応する答え情報を得るステップであって、前記予め設定された知識グラフには複数のエンティティが含まれており、前記予め設定された知識グラフのエンティティの間には接続関係があり、前記第3のERNIEモデルが前記問題情報のエンティティを処理するためのものであるステップと、を含む請求項2に記載の方法。
【請求項10】
前記知識グラフシステムに予め設定された知識グラフ及び第3のERNIEモデルに従って、前記問題情報のエンティティを認識し、前記問題情報に対応する答え情報を得るステップは、
前記第3のERNIEモデルに従って前記問題情報のエンティティに対してブロック処理を行い、複数の関連エンティティを得るステップと、
前記問題情報のエンティティ及び得られた関連エンティティを、前記予め設定された知識グラフに入力し、複数の初期答えを得るステップと、
前記第3のERNIEモデルに従って前記複数の初期答えに対して採点処理を行い、前記問題情報に対応する答え情報を得るステップと、を含む請求項9に記載の方法。
【請求項11】
前記現在の問題分析システムが知識グラフシステムである場合、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定するステップは、
前記問題情報のキーワードを抽出するステップであって、前記キーワードがワード特性を持つものであるステップと、
前記知識グラフシステムの予め設定されたルールテンプレートベース、及び前記問題情報のキーワードのワード特性に従って、前記問題情報に対してマッチング処理を行い、前記問題情報に対応するルールテンプレートを決定するステップであって、前記ルールテンプレートベースには、複数のルールテンプレートがあり、前記ルールテンプレートには、順序関係のない複数のスロットが含まれ、前記スロットがワード特性をキャラクタリゼーションし、前記ルールテンプレートの各スロットのワード特性がそれぞれ異なるステップと、
前記問題情報に対応するルールテンプレートに従って、前記問題情報に対して答えマッチングを行い、前記問題情報に対応する答え情報を得るステップと、を含む請求項2に記載の方法。
【請求項12】
前記ルールテンプレートは予め設定された細かなルールベースがあり、前記細かなルールベースには、前記ルールテンプレートに対応する複数の細かなルールテーブルが含まれ、前記細かなルールテーブルには、順序関係のある複数のスロットが含まれ、前記細かなルールテーブルの各スロットのワード特性がそれぞれ異なるか、前記細かなルールテーブルのスロットの一部のワード特性が同じであり、
前記知識グラフシステムの予め設定されたルールテンプレートベース、及び前記問題情報のキーワードのワード特性に従って、前記問題情報に対してマッチング処理を行い、前記問題情報に対応するルールテンプレートを決定するステップは、
前記細かなルールベースの前記予め設定された細かなルールベース、前記問題情報の異なるワード特性のキーワードの数、及び前記問題情報の異なるワード特性のキーワードの間の接続関係に従って、前記問題情報に対してマッチング処理を行い、前記問題情報に対応する細かなルールテーブルを決定するステップと、
前記問題情報のキーワードを、前記問題情報に対応する細かなルールテーブルに記入し、問題説明情報を得るステップと、予め設定された問題説明情報と答え情報との対応関係に従って、得られた問題説明情報に対応する答え情報を、前記問題情報に対応する答え情報として決定するステップと、を含む請求項11に記載の方法。
【請求項13】
前記現在の問題分析システムが推論質疑応答システムである場合、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定するステップは、
前記問題情報のキーワードを抽出するステップであって、前記キーワードがワード特性を持つものであるステップと、
前記推論質疑応答システムにおける予め設定された推論ルールテンプレートベース、前記問題情報のキーワードのワード特性、及び前記問題情報のキーワード間の順序関係に従って、前記問題情報に対してマッチング処理を行い、前記問題情報に対応する推論テンプレートを決定するステップであって、前記推論ルールテンプレートベースには、複数の推論テンプレートが含まれ、前記推論テンプレートには、順序関係のある複数の記入点が含まれ、前記記入点がワード特性を持つものであるステップと、
前記問題情報に対応するコアとなる要素情報を取得して、前記問題情報に対応するコアとなる要素情報、及び前記問題情報に対応する推論テンプレートに従って、前記問題情報に対応する答え情報を決定するステップと、を含む請求項2に記載の方法。
【請求項14】
前記問題情報に対応するコアとなる要素情報、及び前記問題情報に対応する推論テンプレートに従って、前記問題情報に対応する答え情報を決定するステップは、
予め設定されたニューラルネットワークモデルに従って前記問題情報に対応する各推論テンプレートを認識し、最適な推論テンプレートを決定するステップと、
問題情報に対応するコアとなる要素情報及び前記最適な推論テンプレートに従って、前記問題情報に対応する答え情報を決定するステップと、を含む請求項13に記載の方法。
【請求項15】
問題情報に対応するコアとなる要素情報及び前記最適な推論テンプレートに従って、前記問題情報に対応する答え情報を決定するステップは、
前記コアとなる要素情報のワード特性を決定して、前記コアとなる要素情報のワード特性に対応する記入点を得るステップと、
前記コアとなる要素情報のワード特性に対応する記入点を、前記最適な推論テンプレートに追加し、最終的な推論テンプレートを得るステップと、
前記問題情報のキーワード及び前記問題情報に対応するコアとなる要素情報を、前記最終的な推論テンプレートの各記入点に記入し、推論語句を得るステップと、
予め設定された推論語句と答え情報との対応関係に従って、得られた推論語句に対応する答え情報を前記問題情報に対応する答え情報として決定するステップと、を含む請求項14に記載の方法。
【請求項16】
前記システム優先度が予め設定されたものであるか、前記システム優先度がユーザによって確認されたものであるか、前記システム優先度が問題分析システムに含まれたデータのデータ量をキャラクタリゼーションする請求項1に記載の方法。
【請求項17】
前記問題情報の問題タイプを決定するステップは、
前記問題情報の主要情報を抽出するステップであって、前記主要情報がエンティティワード及び/又はムードワードを含むステップと、
予め設定された主要情報と問題タイプとの対応関係に従って、前記問題情報の問題タイプを決定するステップと、を含む請求項1に記載の方法。
【請求項18】
前記問題タイプに対応する問い合わせエンジンを決定するステップは、
予め設定された問題タイプと問い合わせエンジンとのマッピング関係に従って、前記問題タイプに対応する問い合わせエンジンを決定するステップを含み、
前記問題タイプが、数字タイプ、ショートテキストタイプ、ロングテキストタイプ、汎化需要タイプ、判断タイプのうちのいずれかである請求項1に記載の方法。
【請求項19】
マルチシステムに基づくインテリジェントな質問応答装置であって、前記装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニットであって、前記質疑応答命令が問題情報を指示し、前記問題情報の問題タイプを決定するためのものである第1の決定ユニットと、
前記問題タイプに対応する問い合わせエンジンを決定して、前記問い合わせエンジンに基づいて前記問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニットと、
問題分析システムのシステム優先度に従い、前記複数の問題分析システムを順番に採用して前記問題情報を処理するプロセスでは、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定した場合、ユーザに前記答え情報をフィードバックするための第2の決定ユニットと、を含むマルチシステムに基づくインテリジェントな質問応答装置。
【請求項20】
前記複数の問題分析システムは、知識グラフシステム、推論質疑応答システム、ドキュメント質疑応答システム、及びよくある質問(FAQ)質疑応答システムを含み、
前記知識グラフシステムは、問題情報のエンティティに対応する答え情報を指示するためのものであり、
前記推論質疑応答システムは、問題情報に対応する推論テンプレートを指示するためのものであり、前記推論テンプレートが答え情報を決定するためのものであり、前記推論テンプレートには、順序関係のある複数の記入点が含まれ、前記記入点がワード特性を持つものであり、
前記ドキュメント質疑応答システムは、前記問題情報に対応する段落を指示するためのものであり、前記段落が答え情報を決定するためのものであり、
前記FAQ質疑応答システムは、前記問題情報に関連する他の問題を指示するためのものであり、前記他の問題及び前記問題情報が答え情報を決定するためのものである請求項19に記載の装置。
【請求項21】
前記現在の問題分析システムがドキュメント質疑応答システムである場合、前記第2の決定ユニットは、
前記ドキュメント質疑応答システムの第1のデータベースに従って、前記問題情報に対して類似性マッチングを行い、前記問題情報に対応する最適な段落を得るためのマッチングモジュールであって、前記第1のデータベースには複数のドキュメントが含まれており、前記ドキュメントには複数の段落があるマッチングモジュールと、
知識の集積による第1の拡張表現ERNIEモデルに従って、前記最適な段落に対して字数簡素化処理を行い、前記問題情報に対応する答え情報を得るための処理モジュールと、を含む請求項20に記載の装置。
【請求項22】
前記マッチングモジュールは、
前記ドキュメント質疑応答システムの第1のデータベースに従って、前記問題情報に対して類似性マッチングを行い、前記問題情報に類似する複数の候補段落を得ることと、前記問題情報に対応するコアとなる要素情報を取得することと、に用いられる第1の決定サブモジュールと、
前記コアとなる要素情報及び前記候補段落に対して類似度計算を行い、最も高い類似度の候補段落を、前記問題情報に対応する最適な段落として決定するための第2の決定サブモジュールと、を含む請求項21に記載の装置。
【請求項23】
前記コアとなる要素情報は、ユーザ位置情報、ユーザ属性情報、ユーザが使用する端末機器の情報のうちの1つ又は複数を含む請求項22に記載の装置。
【請求項24】
前記現在の問題分析システムがFAQ質疑応答システムである場合、前記第2の決定ユニットは、
前記FAQ質疑応答システムの第2のデータベースに従って、前記問題情報に対して類似性マッチングを行い、前記問題情報に類似する複数の問題テキストを得るためのマッチングモジュールであって、前記第2のデータベースには複数の問題テキストが含まれているマッチングモジュールと、
前記問題情報、及び前記問題情報に類似する複数の問題テキストに従って、前記問題情報に対応する答え情報を決定するための第1の決定モジュールと、を含む請求項20に記載の装置。
【請求項25】
前記第1の決定モジュールは、
前記問題情報及び前記問題情報に類似する複数の問題テキストを、問題セットにおける候補問題として決定するための第1の決定サブモジュールであって、前記候補問題が特徴情報を有する第1の決定サブモジュールと、
問題セットにおける候補問題の特徴情報を、予め設定されたニューラルネットワークモデルに入力し、最適な候補問題を得るための第2の決定サブモジュールと、
予め設定された、候補問題と答え情報との対応関係に従って、前記最適な候補問題に対応する答え情報を、前記問題情報に対応する答え情報として決定するための第3の決定サブモジュールと、を含む請求項24に記載の装置。
【請求項26】
前記装置は、
オリジナルドキュメントを取得し、前記オリジナルドキュメントに対して分割処理を行い、複数のショートテキストを得ることと、第2のERNIEモデルに従って前記ショートテキストに対してブロック処理を行い、前記第2のデータベースの問題テキストを生成することと、に用いられる第1の生成ユニット、
又は、オリジナルドキュメントを取得し、前記オリジナルドキュメントのタイトルを決定することと、前記タイトルを前記第2のデータベースの問題テキストとして決定することと、に用いられる第2の生成ユニット、
又は、オリジナルドキュメントを取得し、前記オリジナルドキュメントに対してコンテンツ構造分析処理を行い、質問特性を持つショートスニペットを得ることと、前記ショートスニペット及び前記ショートスニペットの前記オリジナルドキュメントにおけるオリジナル段落を、予め設定されたモデルに入力し、前記第2のデータベースの問題テキストを得ることと、に用いられる第3の生成ユニットであって、前記ショートスニペットが得られた問題テキストに対応する答え情報である第3の生成ユニット、を含む請求項24に記載の装置。
【請求項27】
前記現在の問題分析システムが知識グラフシステムである場合、前記第2の決定ユニットは、
前記問題情報のエンティティを抽出するための第1の抽出モジュールと、
前記知識グラフシステムに予め設定された知識グラフ及び第3のERNIEモデルに従って、前記問題情報のエンティティを認識し、前記問題情報に対応する答え情報を得るための認識モジュールであって、前記予め設定された知識グラフには複数のエンティティが含まれており、前記予め設定された知識グラフのエンティティの間には接続関係があり、前記第3のERNIEモデルが前記問題情報のエンティティを処理するためのものである認識モジュールと、を含む請求項20に記載の装置。
【請求項28】
前記認識モジュールは、
前記第3のERNIEモデルに従って前記問題情報のエンティティに対してブロック処理を行い、複数の関連エンティティを得るための第1の処理サブモジュールと、
前記問題情報のエンティティ及び得られた関連エンティティを、前記予め設定された知識グラフに入力し、複数の初期答えを得るための入力サブモジュールと、
前記第3のERNIEモデルに従って前記複数の初期答えに対して採点処理を行い、前記問題情報に対応する答え情報を得るための第2の処理サブモジュールと、を含む請求項27に記載の装置。
【請求項29】
前記現在の問題分析システムが知識グラフシステムである場合、前記第2の決定ユニットは、
前記問題情報のキーワードを抽出するための第2の抽出モジュールであって、前記キーワードがワード特性を持つものである第2の抽出モジュールと、
前記知識グラフシステムの予め設定されたルールテンプレートベース、及び前記問題情報のキーワードのワード特性に従って、前記問題情報に対してマッチング処理を行い、前記問題情報に対応するルールテンプレートを決定するための処理モジュールであって、前記ルールテンプレートベースには、複数のルールテンプレートがあり、前記ルールテンプレートには、順序関係のない複数のスロットが含まれ、前記スロットがワード特性をキャラクタリゼーションし、前記ルールテンプレートの各スロットのワード特性がそれぞれ異なる処理モジュールと、
前記問題情報に対応するルールテンプレートに従って、前記問題情報に対して答えマッチングを行い、前記問題情報に対応する答え情報を得るためのマッチングモジュールと、を含む請求項20に記載の装置。
【請求項30】
前記ルールテンプレートは予め設定された細かなルールベースがあり、前記細かなルールベースには、前記ルールテンプレートに対応する複数の細かなルールテーブルが含まれ、前記細かなルールテーブルには、順序関係のある複数のスロットが含まれ、前記細かなルールテーブルの各スロットのワード特性がそれぞれ異なるか、前記細かなルールテーブルのスロットの一部のワード特性が同じであり、
前記処理モジュールは、
前記細かなルールベースの前記予め設定された細かなルールベース、前記問題情報の異なるワード特性のキーワードの数、及び前記問題情報の異なるワード特性のキーワードの間の接続関係に従って、前記問題情報に対してマッチング処理を行い、前記問題情報に対応する細かなルールテーブルを決定するための第1の決定サブモジュールと、
前記問題情報のキーワードを、前記問題情報に対応する細かなルールテーブルに記入し、問題説明情報を得ることと、予め設定された問題説明情報と答え情報との対応関係に従って、得られた問題説明情報に対応する答え情報を、前記問題情報に対応する答え情報として決定することと、に用いられる第2の決定サブモジュールと、を含む請求項29に記載の装置。
【請求項31】
前記現在の問題分析システムが推論質疑応答システムである場合、前記第2の決定ユニットは、
前記問題情報のキーワードを抽出するための抽出モジュールであって、前記キーワードがワード特性を持つものである抽出モジュールと、
前記推論質疑応答システムにおける予め設定された推論ルールテンプレートベース、前記問題情報のキーワードのワード特性、及び前記問題情報のキーワード間の順序関係に従って、前記問題情報に対してマッチング処理を行い、前記問題情報に対応する推論テンプレートを決定するための処理モジュールであって、前記推論ルールテンプレートベースには、複数の推論テンプレートが含まれ、前記推論テンプレートには、順序関係のある複数の記入点が含まれ、前記記入点がワード特性を持つものである処理モジュールと、
前記問題情報に対応するコアとなる要素情報を取得して、前記問題情報に対応するコアとなる要素情報、及び前記問題情報に対応する推論テンプレートに従って、前記問題情報に対応する答え情報を決定するための決定モジュールと、を含む請求項20に記載の装置。
【請求項32】
前記決定モジュールは、
予め設定されたニューラルネットワークモデルに従って前記問題情報に対応する各推論テンプレートを認識し、最適な推論テンプレートを決定するための第1の決定サブモジュールと、
問題情報に対応するコアとなる要素情報及び前記最適な推論テンプレートに従って、前記問題情報に対応する答え情報を決定するための第2の決定サブモジュールと、を含む請求項31に記載の装置。
【請求項33】
前記第2の決定サブモジュールは、さらに、
前記コアとなる要素情報のワード特性を決定して、前記コアとなる要素情報のワード特性に対応する記入点を得ることと、
前記コアとなる要素情報のワード特性に対応する記入点を、前記最適な推論テンプレートに追加し、最終的な推論テンプレートを得ることと、
前記問題情報のキーワード及び前記問題情報に対応するコアとなる要素情報を、前記最終的な推論テンプレートの各記入点に記入し、推論語句を得ることと、
予め設定された推論語句と答え情報との対応関係に従って、得られた推論語句に対応する答え情報を前記問題情報に対応する答え情報として決定することと、に用いられる請求項32に記載の装置。
【請求項34】
前記システム優先度が予め設定されたものであるか、前記システム優先度がユーザによって確認されたものであるか、前記システム優先度が問題分析システムに含まれたデータのデータ量をキャラクタリゼーションする請求項19に記載の装置。
【請求項35】
前記第1の決定ユニットは、
前記問題情報の主要情報を抽出するための抽出モジュールであって、前記主要情報がエンティティワード及び/又はムードワードを含む抽出モジュールと、
予め設定された主要情報と問題タイプとの対応関係に従って、前記問題情報の問題タイプを決定するための決定モジュールと、を含む請求項19に記載の装置。
【請求項36】
前記呼び出しユニットは、
予め設定された問題タイプと問い合わせエンジンとのマッピング関係に従って、前記問題タイプに対応する問い合わせエンジンを決定するための決定モジュールを含み、
前記問題タイプが、数字タイプ、ショートテキストタイプ、ロングテキストタイプ、汎化需要タイプ、判断タイプのうちのいずれかである請求項19~35のいずれか1項に記載の装置。
【請求項37】
電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサが請求項1~18のいずれか1項に記載の方法を実行できる電子機器。
【請求項38】
コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項1~18のいずれか1項に記載の方法を実行させるために用いられる非一時的なコンピュータ可読記憶媒体。
【請求項39】
コンピュータプログラムであって、前記コンピュータプログラムがプロセッサにより実行されると、請求項1~18のいずれか1項に記載の方法が実現されるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、人工知能における知識グラフに関し、特に、マルチシステムに基づくインテリジェントな質問応答方法、装置及び機器に関する。
【背景技術】
【0002】
インテリジェント技術及び自然言語技術の発展につれ、ユーザにインテリジェントな質問応答を提供することができるようになった。ユーザは音声問題又はテキスト問題を提供し、インテリジェントシステムはユーザにその答えを提供する。
【0003】
従来、よくある質問(frequently-asked questions、FAQと略称)システムを採用してユーザから入力された問題情報を処理して、ユーザにその答えを出力する。
【0004】
しかしながら、上記方法において、FAQシステムでは問題及びその問題に対応する答えが予め設定されており、その問題に対応する答えを直接検索することで答えを決定しているが、FAQシステムではその答えが予め設定されていない場合、ユーザから入力された問題情報に対応する答えを問い合わせることができず、幅広い回答需要を満たすことができなくなっている。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示は、マルチシステムに基づくインテリジェントな質問応答方法、装置及び機器を提供する。
【課題を解決するための手段】
【0006】
第1の態様によれば、本開示は、マルチシステムに基づくインテリジェントな質問応答方法を提供し、前記方法は、
ユーザの質疑応答命令に応答するステップであって、前記質疑応答命令が問題情報を指示し、前記問題情報の問題タイプを決定するためのものであるステップと、
前記問題タイプに対応する問い合わせエンジンを決定して、前記問い合わせエンジンに基づいて前記問い合わせエンジンに対応する複数の問題分析システムを呼び出すステップと、
問題分析システムのシステム優先度に従い、前記複数の問題分析システムを順番に採用して前記問題情報を処理するプロセスでは、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定した場合、ユーザに前記答え情報をフィードバックするステップと、を含む。
【0007】
第2の態様によれば、本開示は、マルチシステムに基づくインテリジェントな質問応答装置を提供し、前記装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニットであって、前記質疑応答命令が問題情報を指示し、前記問題情報の問題タイプを決定するためのものである第1の決定ユニットと、
前記問題タイプに対応する問い合わせエンジンを決定して、前記問い合わせエンジンに基づいて前記問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニットと、
問題分析システムのシステム優先度に従い、前記複数の問題分析システムを順番に採用して前記問題情報を処理するプロセスでは、現在の問題分析システムに従って前記問題情報に対応する答え情報を決定した場合、ユーザに前記答え情報をフィードバックするための第2の決定ユニットと、を含む。
【0008】
第3の態様によれば、本開示は、電子機器を提供し、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサが第1の態様に記載の方法を実行できる。
【0009】
第4の態様によれば、本開示は、コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体を提供し、前記コンピュータ命令は、コンピュータに第1の態様に記載の方法を実行させるためのものである。
【0010】
第5の態様によれば、本開示は、コンピュータプログラムを提供し、前記コンピュータプログラムが可読記憶媒体に記憶されており、電子機器の少なくとも1つのプロセッサは前記可読記憶媒体から前記コンピュータプログラムを読み取ることができ、前記少なくとも1つのプロセッサが前記コンピュータプログラムを実行すると、電子機器が第1の態様に記載の方法を実行する。
【発明の効果】
【0011】
本開示の技術によれば、現在のFAQシステムでユーザの幅広い回答需要を満たすことができないという問題は解決される。
【0012】
なお、この部分に記載されている内容は、本開示の実施例の主要な又は重要な特徴を特定することを意図しておらず、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の詳細の説明を通じて容易に理解される。
【図面の簡単な説明】
【0013】
図面は、本解決策をよりよく理解するために使用され、本願を限定するものではない。
【
図10】本開示の第9の実施例による概略図である。
【
図11】本開示の実施例のマルチシステムに基づくインテリジェントな質問応答方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0014】
以下、本開示の例示的な実施例について、図面を参照して説明し、理解を容易にするために、その中には本開示の実施例の様々な詳細事項が含まれており、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本開示の範囲及び精神から逸脱することなく、詳細の説明に記載れている実施例に対して様々な変更及び修正を行うことができる。同様に、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
【0015】
本開示は、人工知能の分野における知識グラフの分野に適用される、マルチシステムに基づくインテリジェントな質問応答方法、装置及び機器を提供し、現在のFAQシステムでユーザの幅広い回答需要を満たすことができないという問題を解決する。
【0016】
本開示では、
図1は、本開示の第1の実施例による概略図であり、複数の問題分析システムが含まれており、決定応用層101においてユーザの質疑応答命令を取得した後、決定応用層101において当該ユーザの質疑応答命令を分類し、当該ユーザの質疑応答命令によって指示される問題情報を決定し、当該問題情報に従って最終的な問題タイプを決定し、問題タイプが問い合わせエンジン層102にあり、問い合わせエンジン層102において問題タイプを決定した後、コアサービス層103において問題分析システムのタイプを決定し、問題分析システムが基礎データ層104におけるさまざまなデータベースからデータ情報を取得し、基礎データ層104におけるデータタイプは、知識グラフ、SQL/テーブル、ルールベース、ドキュメントベース、FAQベース及び専門用語ベースを含む。
【0017】
図2は、本開示の第1の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答方法を提供し、当該方法は、以下のステップを含む。
【0018】
S201では、ユーザの質疑応答命令に応答し、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである。
【0019】
一例では、ユーザの質疑応答命令とは、ユーザがエンタープライズドキュメントで送信した問い合わせ命令メッセージのことであり、問い合わせ命令メッセージが文字形式であってもよいし、音声形式であってもよい。さらに、エンタープライズドキュメントは、写真や、ディレクトリ、タイトル、テーブル、数式などのコンテンツを含むことができ、エンタープライズドキュメントに含まれたコンテンツは長さが長く、種類も多い。したがって、ユーザの質疑応答命令に従って質疑応答命令によって指示される問題情報の問題タイプを分析した後、問題タイプに従い、エンタープライズドキュメントでユーザの質疑応答命令を問い合わせる。問題タイプは、ユーザの質疑応答命令のタイプを区別するためのものである。このようにすると、問題タイプに応じて、当該問題タイプに必要なデータを問い合わせ、問い合わせ効率を向上させることができるような利点がある。
【0020】
S202では、問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出す。
【0021】
一例では、問い合わせエンジンは、予め設定されたアルゴリズムに従い、ユーザに全面的な情報サービスを提供するものであり、予め設定されたアルゴリズムは、ウェブクローラーアルゴリズム、検索ソートアルゴリズム、ウェブページ処理アルゴリズム、ビッグデータ処理アルゴリズム及び自然言語処理アルゴリズムを含む。本実施例では、異なる問い合わせエンジンによって決定される問題分析システムのコンテンツは異なり、例えば、問い合わせエンジンは、数字タイプのエンジン、ショートテキストタイプのエンジン、ロングテキストタイプのエンジン、汎化需要タイプのエンジン及び判断タイプのエンジンを含んでもよい。このようにすると、異なるエンジンで採用されるアルゴリズムが異なり、それによって問い合わせ効率が向上するような利点がある。
【0022】
S203では、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックする。
【0023】
本実施例では、問題分析システムのシステム優先度の順番を取得した後、現在の問題分析システムの優先度が第1の優先度である場合、現在の問題分析システムに従って問題情報を処理して、現在の問題分析システムに従って当該問題情報に対応する答え情報を取得し、答え情報をユーザにフィードバックするが、第1の優先度の問題分析システムによって取得される答え情報が空の場合、第2の優先度の問題分析システムを利用して問題情報を処理して、第2の優先度の問題分析システムに従って当該問題情報に対応する答え情報を取得し、答え情報をユーザにフィードバックするが、第2の優先度の問題分析システムによって取得される答え情報も空の場合、第3の優先度の問題分析システムを利用して、答え情報を取得するまで問題情報を処理する。さらに、異なる問題分析システムが同一の問題情報を処理するプロセスでは、決定される答え情報が異なり、低い優先度の問題分析システムによって決定される答え情報よりも、高い優先度の問題分析システムによって決定される答え情報の方が正確である。
【0024】
本開示は、マルチシステムに基づくインテリジェントな質問応答方法を提供し、ユーザの質疑応答命令に応答することにより、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものであり、問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出し、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックする。本解決策を採用すれば、現在のFAQシステムでユーザの幅広い回答需要を満たすことができないという問題を解決できる。
【0025】
図3は、本開示の第2の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答方法を提供し、当該方法は、以下のステップを含む。
【0026】
S301では、ユーザの質疑応答命令に応答し、質疑応答命令が問題情報を指示し、問題情報の主要情報を抽出するためのものであり、主要情報がエンティティワード及び/又はムードワードを含む。
【0027】
一例では、問題情報が複数の主要情報を含み、異なる主要情報が示している意味は違い、さらに、主要情報がエンティティワード及びムードワードを含むか、主要情報がエンティティワード又はムードワードを含み、エンティティワードとして、地名、人名又は属性が挙げられるが、ムードワードとして、か、の又はとなどの接続詞が挙げられる。
【0028】
本実施例では、問題情報の主要情報を抽出することにより、問題情報が示している語義コンテンツは分析でき、例えば、問題情報がAの身長がどれくらいですかである場合、当該問題情報の主要情報がエンティティワードの「A」、ムードワードの「の」、エンティティワードの「身長」、ムードワードの「が…です」及びムードワードの「どのぐらい」となる。
【0029】
S302では、予め設定された主要情報と問題タイプとの対応関係に従って、問題情報の問題タイプを決定し、問題タイプが、数字タイプ、ショートテキストタイプ、ロングテキストタイプ、汎化需要タイプ、判断タイプのうちのいずれである。
【0030】
一例では、予め設定された主要情報と問題タイプとの間には対応関係があり、例えば、予め設定された主要情報は「どのぐらい」に対応する問題タイプの数字タイプであってもよいし、予め設定された主要情報は「が…ですか」に対応する問題タイプの判断タイプなどであってもよい。主要情報を取得した後、予め設定された主要情報と問題タイプとの対応関係に従って、当該問題情報が属する問題タイプは決定される。
【0031】
S303では、予め設定された問題タイプと問い合わせエンジンとのマッピング関係に従って、問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出す。
【0032】
一例では、予め設定された問題タイプと問い合わせエンジンとの間にはマッピング関係があり、異なる問題タイプに使用される問い合わせエンジンが異なり、異なる問い合わせエンジンに使用されるアルゴリズムが異なるため、決定された問い合わせエンジンが異なると、呼び出された問題分析システムに使用されるアルゴリズムも異なり、呼び出された問題分析システムによって分析されるデータの種類も異なる。しかし、異なる問い合わせエンジンによって呼び出される問題分析システムの優先度が同じである。
【0033】
さらに、複数の問題分析システムは、知識グラフシステム、推論質疑応答システム、ドキュメント質疑応答システム、よくある質問(FAQ)質疑応答システムを含む。
【0034】
知識グラフシステムは、問題情報のエンティティに対応する答え情報を指示するためのものである。
【0035】
推論質疑応答システムは、問題情報に対応する推論テンプレートを指示するためのものであり、推論テンプレートが答え情報を決定するためのものであり、推論テンプレートには、順序関係のある複数の記入点が含まれ、記入点がワード特性を持つものである。
【0036】
ドキュメント質疑応答システムは、問題情報に対応する段落を指示するためのものであり、段落が答え情報を決定するためのものである。
【0037】
FAQ質疑応答システムは、問題情報に関連する他の問題を指示するためのものであり、他の問題及び問題情報が答え情報を決定するためのものである。
【0038】
本実施例では、知識グラフシステムは、知識発展プロセス及び構造的関係を表示する一連のさまざまな異なるグラフで構成されたシステムであり、知識リソース及びそれらのキャリアは、視覚化技術を利用して説明され、知識及びそれらの間の相互関係はマイニング、分析、構築、描画及び表示されることができる。知識グラフシステムは、知識グラフの知識ベースから問題情報が入力され、問題情報に対して語義理解及び解析を行うことにより、知識グラフベースにおいて自動的に問い合わせて計算し、推論して答えを見つけることができる。
【0039】
推論質疑応答システムは、特定の推論ルールに従って問い合わせて計算することにより、答えを得るシステムであり、推論ルールが簡単な答え計算論理であってもよい。
【0040】
ドキュメント質疑応答システムとは、ドキュメント知識ベース向きの質疑応答システムであり、コアとなる技術が機械読解であり、機械読解とは、機械がテキストを読み、読んだコンテンツに関連する問題に回答するようにして、コンピュータがテキストデータから知識を取得して問題に回答する能力を備えるようにしてもらうことである。
【0041】
よくある質問(frequently-asked questions、FAQと略称)FAQ質疑応答システムは、いくつかの可能なよくある質疑応答ペアを予め提供し、上記したよくある質疑応答ペアを公開する。このようにすると、複数の問題分析システムが組み合わせて使用され、各問題分析システムの利点がよく活用されるような利点がある。
【0042】
さらに、システム優先度が予め設定されたものであるか、システム優先度がユーザによって確認されたものであるか、システム優先度が問題分析システムに含まれたデータのデータ量をキャラクタリゼーションするものである。
【0043】
本実施例では、システム優先度は予め設定されたものであってもよく、例えば、システム優先度は、高い方から低い方へ、よくある質問(FAQ)質疑応答システム、知識グラフシステム、推論質疑応答システム、ドキュメント質疑応答システムの順になっている。システム優先度はユーザによって確認されたものであってもよく、この場合に、設定されたシステム優先度は、ユーザの好みに従って設定でき、例えば、ユーザは、知識グラフシステムの優先度をドキュメント質疑応答システムよりも高くする必要がある場合、知識グラフシステムの優先度順位を優先して設定する。このようにすると、さまざまな応用シーンに適用できるようになり、それによって推薦される答え情報が高い正確性のものになるような利点がある。
【0044】
さらに、システム優先度は問題分析システムに含まれたデータのデータ量の多寡に応じたものであってもよく、データ量が多い問題分析システムの優先度は高く、データが少ない問題分析システムの優先度は低い。例えば、ドキュメント質疑応答システムのデータのデータ量がFAQ質疑応答システムのデータのデータ量よりも多い場合、ドキュメント質疑応答システムのシステム優先度をFAQ質疑応答システムのシステム優先度よりも高い優先度に設定する。
【0045】
S304では、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックする。
【0046】
例示的に、本ステップは、ステップS203を参照することができ、ここで繰り返して説明しない。
【0047】
本開示は、マルチシステムに基づくインテリジェントな質問応答方法を提供し、ユーザの質疑応答命令に応答することにより、質疑応答命令が問題情報を指示し、問題情報の主要情報を抽出するためのものであり、主要情報がエンティティワード及び/又はムードワードを含み、予め設定された主要情報と問題タイプとの対応関係に従って、問題情報の問題タイプを決定し、予め設定された問題タイプと問い合わせエンジンとのマッピング関係に従って、問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出し、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックする。本解決策を採用すれば、答え情報の全体的なリコール率を向上させ、問題情報の語義及び汎化問題を解決することができる。
【0048】
図4は、本開示の第3の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答方法を提供し、具体的には、上記実施例に基づき、現在の問題分析システムに応じて、問題情報に対応する答え情報を決定する方法を提供し、当該方法は、以下のステップを含む。
【0049】
S401では、ユーザの質疑応答命令に応答し、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである。
【0050】
例示的に、本ステップは、ステップS201を参照することができ、ここで繰り返して説明しない。
【0051】
S402では、問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出す。
【0052】
例示的に、本ステップは、ステップS202を参照することができ、ここで繰り返して説明しない。
【0053】
S403では、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムがドキュメント質疑応答システムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定する。
【0054】
一例では、現在の問題分析システムがドキュメント質疑応答システムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定するステップは、
ドキュメント質疑応答システムの第1のデータベースに従って、問題情報に対して類似性マッチングを行い、問題情報に対応する最適な段落を得るステップであって、第1のデータベースには複数のドキュメントが含まれており、ドキュメントには複数の段落があるステップと、
知識の集積による第1の拡張表現ERNIEモデルに従って、最適な段落に対して字数簡素化処理を行い、問題情報に対応する答え情報を得るステップと、を含む。
【0055】
本実施例では、第1のデータベースは、ドキュメントベース及び専門用語ベースを含む。現在の問題分析システムがドキュメント質疑応答システムであると決定した場合、第1のデータベースにおいて問題情報の類似のコンテンツを決定し、具体的に、問題情報に対して類似性マッチングを行うことにより、最も高い類似性の段落を対応する最適な段落として決定してもよい。例えば、第1のデータベースにはさまざまなドキュメントタイプがあるが、それは、ニュースタイプのドキュメントコンテンツ、質疑応答検索タイプのドキュメントコンテンツ及び文献資料タイプのドキュメントコンテンツであってもよい。ニュースタイプのドキュメントコンテンツ、質疑応答検索タイプのドキュメントコンテンツ及び文献資料タイプのドキュメントコンテンツでは、問題情報に対して類似性マッチングを行うことにより、高い類似性のドキュメントの最適な段落を決定し、ERNIE(知識の集積による拡張表現、enhanced representation through knowledge integration)モデルを利用して、最適な段落に対して無意味な単語を削除し、例えば、最適な段落における「が…です」、「か」、「の」を削除して、簡素化された答え情報を得る。
【0056】
さらに、ERNIEモデルは、予め設定された問題情報及び当該問題情報に対応する簡素化された答え情報を利用して訓練することで、問題情報をERNIEモデルに入力した後、ERNIEモデルを利用して最適な段落の字数を簡素化することができる。このようにすると、ドキュメント質疑応答システムにERNIEモデルを追加することで、最後の答え情報の正確性を高くすることができるような利点がある。
【0057】
一例では、ドキュメント質疑応答システムの第1のデータベースに従って、問題情報に対して類似性マッチングを行い、問題情報に対応する最適な段落を得るステップは、
ドキュメント質疑応答システムの第1のデータベースに従って、問題情報に対して類似性マッチングを行い、問題情報に類似する複数の候補段落を得るステップと、問題情報に対応するコアとなる要素情報を取得するステップと、
コアとなる要素情報及び候補段落に対して類似度計算を行い、最も高い類似度の候補段落を問題情報に対応する最適な段落として決定するステップと、を含む。
【0058】
本実施例では、コアとなる要素情報は、ユーザ位置情報、ユーザ属性情報、ユーザが使用する端末機器の情報のうちの1つ又は複数を含む。このようにすると、コアとなる要素情報のコンテンツを増やすことで、候補段落類似度の正確性を向上させることができるような利点がある。
【0059】
一例では、第1のデータベースでは、問題情報に類似する複数の候補段落を決定し、複数の候補段落を決定した後、問題情報のコアとなる要素情報を取得し、コアとなる要素情報は、ユーザ位置情報、ユーザ属性情報、及びユーザが使用する端末機器の情報であってもよい。ユーザ属性情報は、ユーザの名前、ユーザの身長、ユーザの年齢、及びユーザの好みなど、ユーザ自身の特徴を説明できる情報であってもよい。
【0060】
本実施例では、コアとなる要素情報と、複数の候補段落と、に対して類似度計算を行うことにより、最も高い類似度の候補段落を決定し、最も高い類似度の候補段落を最適な段落としている。このようにすると、コアとなる要素情報及び複数の候補段落を利用して、問題情報に対応する最適な段落を迅速に決定することができ、それにより、最適な段落の正確性を向上させることができるような利点がある。
【0061】
S404では、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムがFAQ質疑応答システムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定する。
【0062】
一例では、現在の問題分析システムがFAQ質疑応答システムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定するステップは、
FAQ質疑応答システムの第2のデータベースに従って、問題情報に対して類似性マッチングを行い、問題情報に類似する複数の問題テキストを得るステップであって、第2のデータベースには複数の問題テキストが含まれているステップと、
問題情報及び問題情報に類似する複数の問題テキストに従って、問題情報に対応する答え情報を決定するステップと、を含む。
【0063】
一例では、第2のデータベースは、FAQベース及び専門用語ベースを含み、第2のデータベースでは、問題情報に類似する複数の問題テキストを決定し、そして、問題情報及び複数の問題テキストの両方に従って問題情報に対応する答え情報を決定する。例えば、問題情報は「Aの年齢がいくつですか」である場合、第2のデータベースでは、当該問題情報に対して類似性マッチングを行うことができ、そうすると、複数の問題テキストとして「Aの生年月日は何ですか」や「Aは今年で何歳ですか」を得ることができ、そして、得られた問題情報及び複数の問題テキストの両方に従って対応する答え情報を決定する。このようにすると、問題情報の汎化能力を向上させ、さらに、フィードバックされる答え情報をより正確にすることができるような利点がある。
【0064】
一例では、問題情報及び問題情報に類似する複数の問題テキストに従って、問題情報に対応する答え情報を決定するステップは、
問題情報及び問題情報に類似する複数の問題テキストを、問題セットにおける候補問題として決定するステップであって、候補問題が特徴情報を有するステップと、
問題セットにおける候補問題の特徴情報を、予め設定されたニューラルネットワークモデルに入力し、最適な候補問題を得るステップと、
予め設定された、候補問題と答え情報との対応関係に従って、最適な候補問題に対応する答え情報を、問題情報に対応する答え情報として決定するステップと、を含む。
【0065】
本実施例では、問題情報及び複数の問題テキストを問題セットにおける候補問題として決定しており、候補問題には、同一の特徴情報があり、例えば、候補問題に含まれる問題として、「Aの年齢がいくつですか」、「Aの生年月日は何ですか」、及び「Aは今年で何歳ですか」が挙げられ、上記候補問題の特徴情報が年齢になっているため、年齢という取得された特徴情報をニューラルネットワークモデルに入力し、最適な候補問題を決定し、そして、最適な候補問題と答え情報との対応関係に従って、答え情報を決定し、当該答え情報を当該問題情報に対応する答え情報とする。例えば、最適な候補問題が「Aは今年で何歳ですか」で、得られる答え情報が27である場合、27を問題情報の「Aの年齢がいくつですか」の答え情報とする。このようにすると、最適な候補問題を決定した後、最適な候補問題に対応する答え情報を直接最後の答え情報とするため、答え情報の決定時間を節約することができるような利点がある。
【0066】
一例では、第2のデータベースの複数の問題テキストの生成プロセスは、
オリジナルドキュメントを取得し、オリジナルドキュメントに対して分割処理を行い、複数のショートテキストを得て、第2のERNIEモデルに従ってショートテキストに対してブロック処理を行い、第2のデータベースの問題テキストを生成するプロセス、
又は、オリジナルドキュメントを取得し、オリジナルドキュメントのタイトルを決定し、タイトルを第2のデータベースの問題テキストとして決定するプロセス、
又は、オリジナルドキュメントを取得し、オリジナルドキュメントに対してコンテンツ構造分析処理を行い、質問特性を持つショートスニペットを得て、ショートスニペット及びショートスニペットのオリジナルドキュメントにおけるオリジナル段落を、予め設定されたモデルに入力し、第2のデータベースの問題テキストを得て、ショートスニペットが得られた問題テキストに対応する答え情報であるプロセスである。
【0067】
本実施例では、オリジナルドキュメントは、さまざまな形成で存在するドキュメントデータであってもよく、オリジナルドキュメントを取得した後、オリジナルドキュメントに対して分割処理を行うが、それは、語義関係に従ってオリジナルドキュメントを分割する処理であってもよく、例えば、オリジナルドキュメントでは、同一の語義を示すドキュメントを分割することで、複数のショートテキストを得て、第2のERNIEモデルに従ってショートテキストの単語の一部に対してブロック処理を行うことで、複数の問題テキストを得ることができる。この過程では、適用される技術として、段落認識技術、答え段落認識技術、質疑応答段落マッチング技術及びノイズリダクション技術が挙げられる。
【0068】
本実施例では、オリジナルドキュメントを取得した後、オリジナルドキュメントのタイトル又はサブタイトルを抽出し、タイトル又はサブタイトルの形式を問題の形式に変更するか、タイトルを継ぎ合わして問題テキストとする。
【0069】
本実施例では、オリジナルドキュメントを取得した後、オリジナルドキュメントの文字コンテンツに対して分析、具体的には、コンテンツ構造分析処理を行うことができ、オリジナルドキュメントの接続詞を抽出し、質問特性を持つショートスニペットを得た後、ショートスニペット及びショートスニペットのあるオリジナル段落をニューラルネットワークモデルに入力し、第2のデータベースの問題テキストを決定する。このようにすると、第2のデータベースの問題テキストは可能な限り多く提供され、この後に行われる問題情報の問い合わせが可能になるような利点がある。
【0070】
S405では、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムが知識グラフシステムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定する。
【0071】
一例では、現在の問題分析システムが知識グラフシステムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定するステップは、
問題情報のエンティティを抽出するステップと、
知識グラフシステムに予め設定された知識グラフ及び第3のERNIEモデルに従って、問題情報のエンティティを認識し、問題情報に対応する答え情報を得るステップであって、予め設定された知識グラフには複数のエンティティが含まれており、予め設定された知識グラフのエンティティの間には接続関係があり、第3のERNIEモデルが問題情報のエンティティを処理するためのものであるステップと、を含む。
【0072】
一例では、問題情報のエンティティを抽出した後、知識グラフシステムに予め設定された知識グラフ及び第3のERNIEモデルを利用して、予め設定された知識グラフではエンティティを決定した後、エンティティに関連する答え情報を決定し、さらに、エンティティの認識が第3のERNIEモデルによって実現されている。このようにすると、ERNIEモデルを使用することで、知識グラフシステムによるエンティティ決定の正確率を向上させるような利点がある。
【0073】
一例では、知識グラフシステムに予め設定された知識グラフ及び第3のERNIEモデルに従って、問題情報のエンティティを認識し、問題情報に対応する答え情報を得るステップは、
第3のERNIEモデルに従って問題情報のエンティティに対してブロック処理を行い、複数の関連エンティティを得るステップと、
問題情報のエンティティ及び得られた関連エンティティを、予め設定された知識グラフに入力し、複数の初期答えを得るステップと、
第3のERNIEモデルに従って複数の初期答えに対して採点処理を行い、問題情報に対応する答え情報を得るステップと、を含む。
【0074】
本実施例では、問題情報から認識されたエンティティに対してブロック処理を行い、当該エンティティに関連する複数の関連エンティティを決定した後、問題情報のエンティティ及び関連エンティティを予め設定された知識グラフに入力し、複数の初期答えを決定し、そして、第3のERNIEモデルに従って複数の初期答えに対して採点処理を行い、問題情報に対応する答え情報を得る。このようにすると、決定された答え情報の正確率を向上させることができるような利点がある。
【0075】
一例では、現在の問題分析システムが知識グラフシステムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定するステップは、
問題情報のキーワードを抽出するステップであって、キーワードがワード特性を持つものであるステップと、
知識グラフシステムの予め設定されたルールテンプレートベース、及び問題情報のキーワードのワード特性に従って、問題情報に対してマッチング処理を行い、問題情報に対応するルールテンプレートを決定するステップであって、ルールテンプレートベースには、複数のルールテンプレートがあり、ルールテンプレートには、順序関係のない複数のスロットが含まれ、スロットがワード特性をキャラクタリゼーションし、ルールテンプレートの各スロットのワード特性がそれぞれ異なるステップと、
問題情報に対応するルールテンプレートに従って、問題情報に対して答えマッチングを行い、問題情報に対応する答え情報を得るステップと、を含む。
【0076】
本実施例では、問題情報のキーワードを抽出しており、問題情報の各々の単語がいずれもキーワードであるが、各キーワードが属するワード特性はそれぞれ異なり、ワード特性がエンティティ、属性、疑問助詞、ストップワード、接続詞及びジャンプワードを含む。本実施例におけるスロットは、キーワードが配置される1つの位置のことであり、スロットに応じて、配置されるキーワードが異なる。
【0077】
本実施例では、予め設定されたルールテンプレートベースに従って、問題情報のキーワードに含まれるワード特性を決定し、問題情報に対応するルールテンプレートを決定した後、問題情報に対して答えマッチングを行っている。
【0078】
本実施例では、ルールテンプレートベースには、エンティティ、属性及び疑問助詞に係るルールが含まれ、さらに、属性、疑問助詞及び接続詞に係るルール、および、エンティティ、ジャンプワード及び属性に係るルールが含まれる。例えば、問題情報に含まれるワード特性がエンティティ、属性及び疑問助詞である場合、当該問題情報をルールテンプレートベースの第1のルールに対応し、第1のルールを利用して当該問題情報に対応する答え情報を決定する。このようにすると、ルールテンプレートを予め提供し、問題情報を迅速に特定できるような利点がある。
【0079】
一例では、ルールテンプレートは予め設定された細かなルールベースがあり、細かなルールベースには、ルールテンプレートに対応する複数の細かなルールテーブルが含まれ、細かなルールテーブルには、順序関係のある複数のスロットが含まれ、細かなルールテーブルの各スロットのワード特性がそれぞれ異なるか、細かなルールテーブルのスロットの一部のワード特性が同じである。
【0080】
知識グラフシステムの予め設定されたルールテンプレートベース、及び問題情報のキーワードのワード特性に従って、問題情報に対してマッチング処理を行い、問題情報に対応するルールテンプレートを決定するステップは、
細かなルールベースの予め設定された細かなルールベース、問題情報の異なるワード特性のキーワードの数、及び問題情報の異なるワード特性のキーワードの間の接続関係に従って、問題情報に対してマッチング処理を行い、問題情報に対応する細かなルールテーブルを決定するステップと、
問題情報のキーワードを問題情報に対応する細かなルールテーブルに記入し、問題説明情報を得るステップと、予め設定された問題説明情報と答え情報との対応関係に従って、得られた問題説明情報に対応する答え情報を、問題情報に対応する答え情報として決定するステップと、を含む。
【0081】
本実施例では、ルールテンプレートには、複数の細かなルールベースが含まれ、それぞれのルールテンプレートにおける複数のスロットのワード特性が同じであるが、それぞれのルールテンプレートの細かなルールテーブルにおける複数のスロットには順序関係があり、例えば、ルールテンプレートの第1のルールはエンティティ、属性及び疑問助詞であると、細かなルールベースに含まれる細かなルールはエンティティ、属性及び疑問助詞に係るルールであってもよいが、さらに、エンティティ、属性、エンティティ及び疑問助詞に係るルールを含んでもよいし、エンティティ、疑問助詞及び属性に係るルールを含んでもよい。
【0082】
本実施例では、問題情報の異なるワード特性のキーワードの数、及び問題情報の異なるワード特性のキーワードの間の接続関係を決定した後、当該問題情報に対してマッチング処理を行い、問題情報に対応する細かなルールテーブルを決定しており、例えば、この場合に決定された細かなルールテーブルはエンティティ、属性及び疑問助詞に係るテーブルであると、問題情報のキーワードを記入し、細かなルールテーブルにおける問題情報を利用して対応する答え情報を決定する。例えば、問題情報は「Aの年齢がいくつですか」であり、「A」がエンティティで、「の」が接続詞で、「年齢」が属性で、「が」が接続詞で、「いくつ」が疑問助詞である場合、ルールテンプレートベースでは、エンティティ、接続詞、属性及び疑問助詞に係るルールテンプレートを決定することができ、当該ルールテンプレートでは、2つの接続詞、1つのエンティティ単語、1つの属性、1つの疑問助詞に係る細かなルールテーブルを決定し、問題説明情報を得て、それによって、予め設定された問題説明情報と答え情報との対応関係に従って、得られた問題説明情報に対応する答え情報を決定し、当該答え情報が問題情報に対応する答え情報である。このようにすると、答え情報の全体的なリコール率を向上できるような利点がある。
【0083】
S406では、問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムが推論質疑応答システムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定する。
【0084】
一例では、現在の問題分析システムが推論質疑応答システムである場合、現在の問題分析システムに従って問題情報に対応する答え情報を決定するステップは、
問題情報のキーワードを抽出するステップであって、キーワードがワード特性を持つものであるステップと、
推論質疑応答システムの予め設定された推論ルールテンプレートベース、問題情報のキーワードのワード特性、及び問題情報のキーワード間の順序関係に従って、問題情報に対してマッチング処理を行い、問題情報に対応する推論テンプレートを決定するステップであって、推論ルールテンプレートベースには、複数の推論テンプレートが含まれ、推論テンプレートには、順序関係のある複数の記入点が含まれ、記入点がワード特性を持つものであるステップと、
問題情報に対応するコアとなる要素情報を取得し、問題情報に対応するコアとなる要素情報、及び問題情報に対応する推論テンプレートに従って、問題情報に対応する答え情報を決定するステップと、を含む。
【0085】
本実施例では、推論テンプレートにおける複数の記入点は順序付きであり、記入点のワード特性が同じである場合、記入点のワード特性の順序が異なると、示される推論テンプレートが異なり、問題情報に対応するコアとなる要素情報、及び問題情報に対応する推論テンプレートの両方に従って問題情報に対応する答え情報を決定する。このようにすると、ユーザの幅広い質疑応答需要を満たすことができるような利点がある。
【0086】
一例では、問題情報に対応するコアとなる要素情報、及び問題情報に対応する推論テンプレートに従って、問題情報に対応する答え情報を決定するステップは、
予め設定されたニューラルネットワークモデルに従って問題情報に対応する各推論テンプレートを認識し、最適な推論テンプレートを決定するステップと、
問題情報に対応するコアとなる要素情報及び最適な推論テンプレートに従って、問題情報に対応する答え情報を決定するステップと、を含む。
【0087】
本実施例では、複数の推論テンプレートを予め設定されたニューラルネットワークモデルに入力し、予め設定されたニューラルネットワークモデルを利用して最適な推論テンプレートを決定した後、問題情報に対応するコアとなる要素情報を取得し、最適な推論テンプレート及び問題情報に対応するコアとなる要素情報の両方に従って問題情報に対応する答え情報を決定する。このようにすると、答え情報の堅牢性を向上させるような利点がある。
【0088】
一例では、問題情報に対応するコアとなる要素情報及び最適な推論テンプレートに従って、問題情報に対応する答え情報を決定するステップは、
コアとなる要素情報のワード特性を決定し、コアとなる要素情報のワード特性に対応する記入点を得るステップと、
コアとなる要素情報のワード特性に対応する記入点を、最適な推論テンプレートに追加し、最終的な推論テンプレートを得るステップと、
問題情報のキーワード及び問題情報に対応するコアとなる要素情報を、最終的な推論テンプレートの各記入点に記入し、推論語句を得るステップと、
予め設定された推論語句と答え情報との対応関係に従って、得られた推論語句に対応する答え情報を問題情報に対応する答え情報として決定するステップと、を含む。
【0089】
本実施例では、取得されたコアとなる要素情報のワード特性を記入点に記入し、当該コアとなる要素情報を最適な推論テンプレートに追加し、例えば、コアとなる要素情報が地理的位置情報である場合、地理的位置情報をエンティティの記入点に記入し、エンティティの記入点と合わせて最終的な推論テンプレートを決定する。問題情報のキーワードを取得した後、キーワードを記入点にも記入し、最終的な推論テンプレートに従って推論語句を得る。
【0090】
推論語句を得た後、予め設定された推論語句と答え情報との間の関係に従って、最終的な答え情報を決定する。このようにすると、推論語句を利用して正確な答え情報を決定し、答え情報の決定効率を向上させることができるような利点がある。
【0091】
本実施例の方法は、ユーザに答え情報をフィードバックするステップをさらに含む。
【0092】
本開示は、マルチシステムに基づくインテリジェントな質問応答方法を提供し、現在の問題分析システムの違いに応じて、問題情報に対応する答え情報を決定し、現在の問題分析システムが複数あり、これらのシステムは任意に組み合わせることができ、それによって問題情報に対応する答え情報を決定する。本解決策を採用すれば、大量の専門的なエンタープライズドキュメントの中で答え情報を迅速に見つけることができる。
【0093】
図5は、本開示の第4の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答装置500を提供し、当該装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニット501であって、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである第1の決定ユニット501と、
問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニット502と、
問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックするための第2の決定ユニット503と、を含む。
【0094】
当業者は、説明上の便宜や簡潔さのため、上記説明した装置の具体的な作業プロセスが前述した方法の実施例における対応するプロセスを参照できることをよく理解することができ、ここで繰り返して説明しない。
【0095】
図6は、本開示の第5の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答装置600を提供し、当該装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニット601であって、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである第1の決定ユニット601と、
問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニット602と、
問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックするための第2の決定ユニット603と、を含む。
【0096】
一例では、複数の問題分析システムは、知識グラフシステム、推論質疑応答システム、ドキュメント質疑応答システム、及びよくある質問(FAQ)質疑応答システムを含む。
【0097】
知識グラフシステムは、問題情報のエンティティに対応する答え情報を指示するためのものである。
【0098】
推論質疑応答システムは、問題情報に対応する推論テンプレートを指示するためのものであり、推論テンプレートが答え情報を決定するためのものであり、推論テンプレートには、順序関係のある複数の記入点が含まれ、記入点がワード特性を持つものである。
【0099】
ドキュメント質疑応答システムは、問題情報に対応する段落を指示するためのものであり、段落が答え情報を決定するためのものである。
【0100】
FAQ質疑応答システムは、問題情報に関連する他の問題を指示するためのものであり、他の問題及び問題情報が答え情報を決定するためのものである。
【0101】
一例では、システム優先度が予め設定されたものであるか、システム優先度がユーザによって確認されたものであるか、システム優先度が問題分析システムに含まれたデータのデータ量をキャラクタリゼーションする。
【0102】
一例では、第1の決定ユニット601は、
問題情報の主要情報を抽出するための抽出モジュール6011であって、主要情報がエンティティワード及び/又はムードワードを含む抽出モジュール6011と、
予め設定された主要情報と問題タイプとの対応関係に従って、問題情報の問題タイプを決定するための決定モジュール6012と、を含む。
【0103】
一例では、呼び出しユニット602は、
予め設定された問題タイプと問い合わせエンジンとのマッピング関係に従って、問題タイプに対応する問い合わせエンジンを決定するための決定モジュール6021を含む。
【0104】
問題タイプは、数字タイプ、ショートテキストタイプ、ロングテキストタイプ、汎化需要タイプ、判断タイプのうちのいずれかである。
【0105】
当業者は、説明上の便宜や簡潔さのため、上記説明した装置の具体的な作業プロセスが前述した方法の実施例における対応するプロセスを参照できることをよく理解することができ、ここで繰り返して説明しない。
【0106】
図7は、本開示の第6の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答装置700を提供し、当該装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニット701であって、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである第1の決定ユニット701と、
問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニット702と、
問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックするための第2の決定ユニット703と、を含む。
【0107】
一例では、現在の問題分析システムがドキュメント質疑応答システムである場合、第2の決定ユニット703は、
ドキュメント質疑応答システムの第1のデータベースに従って、問題情報に対して類似性マッチングを行い、問題情報に対応する最適な段落を得るためのマッチングモジュール7031であって、第1のデータベースには複数のドキュメントが含まれており、ドキュメントには複数の段落があるマッチングモジュール7031と、
知識の集積による第1の拡張表現ERNIEモデルに従って、最適な段落に対して字数簡素化処理を行い、問題情報に対応する答え情報を得るための処理モジュール7032と、を含む。
【0108】
一例では、マッチングモジュール7031は、
ドキュメント質疑応答システムの第1のデータベースに従って、問題情報に対して類似性マッチングを行い、問題情報に類似する複数の候補段落を得るために使用され、問題情報に対応するコアとなる要素情報を取得するための第1の決定サブモジュール70311と、
コアとなる要素情報及び候補段落に対して類似度計算を行い、最も高い類似度の候補段落を問題情報に対応する最適な段落として決定するための第2の決定サブモジュール70312と、を含む。
【0109】
一例では、コアとなる要素情報は、ユーザ位置情報、ユーザ属性情報、ユーザが使用する端末機器の情報のうちの1つ又は複数を含む。
【0110】
当業者は、説明上の便宜や簡潔さのため、上記説明した装置の具体的な作業プロセスが前述した方法の実施例における対応するプロセスを参照できることをよく理解することができ、ここで繰り返して説明しない。
【0111】
図8は、本開示の第7の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答装置800を提供し、当該装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニット801であって、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである第1の決定ユニット801と、
問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニット802と、
問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックするための第2の決定ユニット803と、を含む。
【0112】
一例では、現在の問題分析システムがFAQ質疑応答システムである場合、第2の決定ユニット803は、
FAQ質疑応答システムの第2のデータベースに従って、問題情報に対して類似性マッチングを行い、問題情報に類似する複数の問題テキストを得るためのマッチングモジュール8031であって、第2のデータベースには複数の問題テキストが含まれているマッチングモジュール8031と、
問題情報及び問題情報に類似する複数の問題テキストに従って、問題情報に対応する答え情報を決定するための第1の決定モジュール8032と、を含む。
【0113】
一例では、第1の決定モジュール8032は、
問題情報及び問題情報に類似する複数の問題テキストを、問題セットにおける候補問題として決定するための第1の決定サブモジュール80321であって、候補問題が特徴情報を有する第1の決定サブモジュール80321と、
問題セットにおける候補問題の特徴情報を、予め設定されたニューラルネットワークモデルに入力し、最適な候補問題を得るための第2の決定サブモジュール80322と、
予め設定された、候補問題と答え情報との対応関係に従って、最適な候補問題に対応する答え情報を、問題情報に対応する答え情報として決定するための第3の決定サブモジュール80323と、を含む。
【0114】
一例では、当該装置は、
オリジナルドキュメントを取得し、オリジナルドキュメントに対して分割処理を行い、複数のショートテキストを得ることと、第2のERNIEモデルに従ってショートテキストに対してブロック処理を行い、第2のデータベースの問題テキストを生成することと、に用いられる第1の生成ユニット804、
又は、オリジナルドキュメントを取得し、オリジナルドキュメントのタイトルを決定することと、タイトルを第2のデータベースの問題テキストとして決定することと、に用いられる第2の生成ユニット805、
又は、オリジナルドキュメントを取得し、オリジナルドキュメントに対してコンテンツ構造分析処理を行い、質問特性を持つショートスニペットを得ることと、ショートスニペット及びショートスニペットのオリジナルドキュメントにおけるオリジナル段落を、予め設定されたモデルに入力し、第2のデータベースの問題テキストを得ることと、に用いられる第3の生成ユニット806であって、ショートスニペットが得られた問題テキストに対応する答え情報である第3の生成ユニット806を含む。
【0115】
当業者は、説明上の便宜や簡潔さのため、上記説明した装置の具体的な作業プロセスが前述した方法の実施例における対応するプロセスを参照できることをよく理解することができ、ここで繰り返して説明しない。
【0116】
図9は、本開示の第8の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答装置900を提供し、当該装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニット901であって、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである第1の決定ユニット901と、
問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニット902と、
問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックするための第2の決定ユニット903と、を含む。
【0117】
一例では、現在の問題分析システムが知識グラフシステムである場合、第2の決定ユニット903は、
問題情報のエンティティを抽出するための第1の抽出モジュール9031と、
知識グラフシステムに予め設定された知識グラフ及び第3のERNIEモデルに従って、問題情報のエンティティを認識し、問題情報に対応する答え情報を得るための認識モジュール9032であって、予め設定された知識グラフには複数のエンティティが含まれており、予め設定された知識グラフのエンティティの間には接続関係があり、第3のERNIEモデルが問題情報のエンティティを処理するためのものである認識モジュール9032と、を含む。
【0118】
一例では、認識モジュール9032は、
第3のERNIEモデルに従って問題情報のエンティティに対してブロック処理を行い、複数の関連エンティティを得るための第1の処理サブモジュール90321と、
問題情報のエンティティ及び得られた関連エンティティを、予め設定された知識グラフに入力し、複数の初期答えを得るための入力サブモジュール90322と、
第3のERNIEモデルに従って複数の初期答えに対して採点処理を行い、問題情報に対応する答え情報を得るための第2の処理サブモジュール90323と、を含む。
【0119】
一例では、現在の問題分析システムが知識グラフシステムである場合、第2の決定ユニット903は、
問題情報のキーワードを抽出するための第2の抽出モジュール9033であって、キーワードがワード特性を持つものである第2の抽出モジュール9033と、
知識グラフシステムの予め設定されたルールテンプレートベース、及び問題情報のキーワードのワード特性に従って、問題情報に対してマッチング処理を行い、問題情報に対応するルールテンプレートを決定するための処理モジュール9034であって、ルールテンプレートベースには、複数のルールテンプレートがあり、ルールテンプレートには、順序関係のない複数のスロットが含まれ、スロットがワード特性をキャラクタリゼーションし、ルールテンプレートの各スロットのワード特性がそれぞれ異なる処理モジュール9034と、
問題情報に対応するルールテンプレートに従って、問題情報に対して答えマッチングを行い、問題情報に対応する答え情報を得るためのマッチングモジュール9035と、を含む。
【0120】
一例では、ルールテンプレートは予め設定された細かなルールベースがあり、細かなルールベースには、ルールテンプレートに対応する複数の細かなルールテーブルが含まれ、細かなルールテーブルには、順序関係のある複数のスロットが含まれ、細かなルールテーブルの各スロットのワード特性がそれぞれ異なるか、細かなルールテーブルのスロットの一部のワード特性が同じである。
【0121】
処理モジュール9034は、
細かなルールベースの予め設定された細かなルールベース、問題情報の異なるワード特性のキーワードの数、及び問題情報の異なるワード特性のキーワードの間の接続関係に従って、問題情報に対してマッチング処理を行い、問題情報に対応する細かなルールテーブルを決定するための第1の決定サブモジュール90341と、
問題情報のキーワードを問題情報に対応する細かなルールテーブルに記入し、問題説明情報を得るために使用され、予め設定された問題説明情報と答え情報との対応関係に従って、得られた問題説明情報に対応する答え情報を、問題情報に対応する答え情報として決定するための第2の決定サブモジュール90342と、を含む。
【0122】
当業者は、説明上の便宜や簡潔さのため、上記説明した装置の具体的な作業プロセスが前述した方法の実施例における対応するプロセスを参照できることをよく理解することができ、ここで繰り返して説明しない。
【0123】
図10は、本開示の第9の実施例による概略図であり、本開示は、マルチシステムに基づくインテリジェントな質問応答装置1000を提供し、当該装置は、
ユーザの質疑応答命令に応答するための第1の決定ユニット1001であって、質疑応答命令が問題情報を指示し、問題情報の問題タイプを決定するためのものである第1の決定ユニット1001と、
問題タイプに対応する問い合わせエンジンを決定して、問い合わせエンジンに基づいて問い合わせエンジンに対応する複数の問題分析システムを呼び出すための呼び出しユニット1002と、
問題分析システムのシステム優先度に従い、複数の問題分析システムを順番に採用して問題情報を処理するプロセスでは、現在の問題分析システムに従って問題情報に対応する答え情報を決定した場合、ユーザに答え情報をフィードバックするための第2の決定ユニット1003と、を含む。
【0124】
一例では、現在の問題分析システムが推論質疑応答システムである場合、第2の決定ユニット1003は、
問題情報のキーワードを抽出するための抽出モジュール10031であって、キーワードがワード特性を持つものである抽出モジュール10031と、
推論質疑応答システムの予め設定された推論ルールテンプレートベース、問題情報のキーワードのワード特性、及び問題情報のキーワード間の順序関係に従って、問題情報に対してマッチング処理を行い、問題情報に対応する推論テンプレートを決定するための処理モジュール10032であって、推論ルールテンプレートベースには、複数の推論テンプレートが含まれ、推論テンプレートには、順序関係のある複数の記入点が含まれ、記入点がワード特性を持つものである処理モジュール10032と、
問題情報に対応するコアとなる要素情報を取得して、問題情報に対応するコアとなる要素情報、及び問題情報に対応する推論テンプレートに従って、問題情報に対応する答え情報を決定するための決定モジュール10033と、を含む。
【0125】
一例では、決定モジュール10033は、
予め設定されたニューラルネットワークモデルに従って問題情報に対応する各推論テンプレートを認識し、最適な推論テンプレートを決定するための第1の決定サブモジュール100331と、
問題情報に対応するコアとなる要素情報及び最適な推論テンプレートに従って、問題情報に対応する答え情報を決定するための第2の決定サブモジュール100332と、を含む。
【0126】
一例では、第2の決定サブモジュール100332は、さらに、
コアとなる要素情報のワード特性を決定し、コアとなる要素情報のワード特性に対応する記入点を得ることと、
コアとなる要素情報のワード特性に対応する記入点を、最適な推論テンプレートに追加し、最終的な推論テンプレートを得ることと、
問題情報のキーワード及び問題情報に対応するコアとなる要素情報を、最終的な推論テンプレートの各記入点に記入し、推論語句を得ることと、
予め設定された推論語句と答え情報との対応関係に従って、得られた推論語句に対応する答え情報を問題情報に対応する答え情報として決定することと、に用いられる。
【0127】
当業者は、説明上の便宜や簡潔さのため、上記説明した装置の具体的な作業プロセスが前述した方法の実施例における対応するプロセスを参照できることをよく理解することができ、ここで繰り返して説明しない。
【0128】
本開示に係る解決策において、関連するユーザの個人情報の収集や、保存、使用、加工、伝送、提供、公開などの処理は、いずれも関連する法令の規定に準拠しており、公序良俗にも違反しない。
【0129】
本開示の実施例によれば、本開示は、さらに、電子機器、可読記憶媒体、及びコンピュータプログラムを提供する。
【0130】
本開示の実施例によれば、本開示は、さらに、コンピュータプログラムを提供し、コンピュータプログラムが可読記憶媒体に記憶されており、電子機器の少なくとも1つのプロセッサは、可読記憶媒体からコンピュータプログラムを読み取ることができ、少なくとも1つのプロセッサがコンピュータプログラムを実行すると、電子機器が上記いずれか1つの実施例により提供される解決策を実行する。
【0131】
図11は、本開示の実施例を実施するために使用可能な例示的な電子機器1100の概略ブロック図を示している。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルアシスタント、セルラ電話、スマートフォン、ウェアラブルデバイス、他の類似する計算デバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本開示の実施を制限することを意図したものではない。
【0132】
図11に示すように、電子機器1100は、計算ユニット1101を含み、当該計算ユニット1101は、読み取り専用メモリ(ROM)1102に記憶されたコンピュータプログラム、または、記憶ユニット1108からランダムアクセスメモリ(RAM)1103にロードされたコンピュータプログラムに基づき、さまざまな、適当な動作及び処理を実行することができる。RAM 1103には、さらに、電子機器1100の操作に必要なさまざまなプログラム及びデータが記憶されることができる。計算ユニット1101、ROM 1102及びRAM 1103は、バス1104を介して接続される。入力/出力(I/O)インタフェース1105も、バス1104に接続される。
【0133】
キーボードやマウスなどの入力ユニット1106と、さまざまなタイプのモニタやスピーカーなどの出力ユニット1107と、磁気ディスクや光ディスクなどの記憶ユニット1108と、ネットワークカードや、モデム、無線通信トランシーバーなどの通信ユニット1109と、を含む、電子機器1100における少なくとも1つのコンポーネントは、I/Oインタフェース1105に接続される。通信ユニット1109は、電子機器1100がインターネットなどのコンピュータネットワーク及び/又はさまざまな電気通信デットワークを介して他の機器と情報/データを交換することを可能にさせる。
【0134】
計算ユニット1101は、処理能力や計算能力を有するさまざまな汎用及び/又は専用処理コンポーネントであってもよい。計算ユニット1101のいくつかの例は、中央処理装置(CPU)、グラフィックスプロセッシングユニット(GPU)、さまざまな専用な人工知能(AI)計算チップ、機械学習モデルアルゴリズムを実行するさまざまな計算ユニット、デジタルシグナルプロセッサ(DSP)、および任意の適当なプロセッサ、コントローラー、マイクロコントローラーなどを含むが、それらに限定されない。計算ユニット1101は、マルチシステムに基づくインテリジェントな質問応答方法などの上記に記載の各方法や処理を実行する。例えば、いくつかの実施例において、マルチシステムに基づくインテリジェントな質問応答方法は、コンピュータソフトウェアプログラムとして実現されることができ、記憶ユニット1108などの機械可読媒体に有形的に含まれている。いくつかの実施例において、コンピュータプログラムの一部またはすべては、ROM 1102及び/又は通信ユニット1109を介して電子機器1100にロード及び/又はインストールされることができる。コンピュータプログラムは、RAM 1103にロードされて計算ユニット1101により実行されると、上記に記載のマルチシステムに基づくインテリジェントな質問応答方法の1つ又は複数のステップを実行することができる。選択的に、他の実施例において、計算ユニット1101は、他の任意の適当な手段(例えば、ファームウェアに頼る)を用いてマルチシステムに基づくインテリジェントな質問応答方法を実行するように構成されることができる。
【0135】
本明細書において、上記に記載のシステム及び技術的さまざまな実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップのシステム(SOC)、ロードプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにより実施されることができる。これらのさまざまな実施形態は、1つ又は複数のコンピュータプログラムに実施され、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサが含まれるプログラマブルシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、専用または汎用プログラマブルプロセッサであってもよく、記憶システムや、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータや命令を受信し、そして、データや命令を当該記憶システム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
【0136】
本開示に係る方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせを採用してプログラミングすることができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又はその他のプログラマブルデータ処理装置のプロセッサ又はコントローラーに提供されることができ、これにより、プログラムコードは、プロセッサ又はコントローラーにより実行されると、フローチャート及び/又はブロック図に示される機能/操作が実施される。プログラムコードは、完全に機械で実行され、部分的に機械で実行されてもよく、独立したソフトウェアパッケージとして部分的に機械で実行され、且つ、部分的にリモートマシンで実行されるか、又は完全にリモートマシン又はサーバで実行されることができる。
【0137】
本開示のコンテキストでは、機械可読媒体は、有形的な媒体であってもよく、命令実行システム、装置又は機器に使用されるプログラム、または、命令実行システム、装置又は機器と組み合わせて使用されるプログラムを含むか又は記憶することができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又は機器、または上記に記載の任意の適合な組み合わせを含むが、それらに限定されない。機械可読記憶媒体のより具体的な例として、1つ又は複数の配線に基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光学的記憶デバイス、磁気的記憶デバイス、又は上記に記載の任意の適合な組み合わせを含む。
【0138】
ユーザとのインタラクションを提供するために、コンピュータ上で、本明細書に説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形態(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
【0139】
本明細書で説明されているシステム及び技術は、バックエンドコンポーネントを含む計算システム(例えば、データサーバとする)、或いは、ミドルウェアコンポーネントを含む計算システム(例えば、アプリケーションサーバ)、或いは、フロントエンドコンポーネントを含む計算システム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、或いは、当該バックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントの任意の組み合わせを含む計算システムで実施することができる。任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの実例は、ローカルネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
【0140】
コンピュータシステムは、クライアント端末とサーバとを含むことができる。クライアント端末とサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント端末-サーバの関係を有するコンピュータプログラムによって、クライアント端末とサーバとの関係が生成される。
【0141】
上記に示される様々な形態のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解すべきである。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている解決策が所望の結果を実現することができれば、本明細書では限定しない。
【0142】
上記の発明を実施するための形態は、本開示の保護範囲を制限するものではない。当業者は、設計要件と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。本開示の精神と原則内で行われる任意の修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。