(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-05
(45)【発行日】2023-12-13
(54)【発明の名称】インテリジェント対話方法、装置、電子機器及び記憶媒体
(51)【国際特許分類】
G06F 16/2452 20190101AFI20231206BHJP
G06F 16/90 20190101ALI20231206BHJP
【FI】
G06F16/2452
G06F16/90 100
(21)【出願番号】P 2022064003
(22)【出願日】2022-04-07
【審査請求日】2022-04-07
(31)【優先権主張番号】202110738818.3
(32)【優先日】2021-06-30
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100118913
【氏名又は名称】上田 邦生
(74)【代理人】
【識別番号】100142789
【氏名又は名称】柳 順一郎
(74)【代理人】
【識別番号】100201466
【氏名又は名称】竹内 邦彦
(72)【発明者】
【氏名】ヘ, ドンフェン
(72)【発明者】
【氏名】チェン, ビンジン
(72)【発明者】
【氏名】チェン, ワンシュン
(72)【発明者】
【氏名】トゥ, ジャヤン
(72)【発明者】
【氏名】リン, インツァン
(72)【発明者】
【氏名】ファン, シウェイ
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特表2020-520516(JP,A)
【文献】米国特許出願公開第2021/0191936(US,A1)
【文献】特開2002-342361(JP,A)
【文献】特開2020-035135(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得するステップであって、前記ターゲットテーブルには、複数の列属性と各列属性の属性値が含まれ、前記事前マッチング結果には、前記各列属性の列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及び前記質問情報とのマッチング度が最も高い属性値が含まれるステップと、
前記質問情報とのマッチング度が最も高い属性値に基づいて、前記質問情報から前記属性値とのマッチング度が最も高い単語セグメントを抽出するステップと、
前記各列属性の属性値から、前記単語セグメントに意味的に関連付けられたターゲット属性値を決定するステップと、
前記質問情報、前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記質問情報に対応するSQLクエリステートメントを生成するステップと、
前記SQLクエリステートメントに基づいてデータベースを検索して、データベース検索の結果に基づいて応答ステートメントを生成するステップと、
を含む
、インテリジェント対話装置によって実行されるインテリジェント対話方法。
【請求項2】
前記処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得するステップが、
前記ターゲットテーブルにおける前記複数の列属性と前記各列属性の属性値とに基づいて、前記ターゲットテーブルに対応する辞書ツリーを確立するステップであって、前記辞書ツリーの各ノードには、マッチングタイプ、マッチングレベル、及び前記各ノードに対応する完全な文字列が含まれるステップと、
前記辞書ツリーに基づいて、前記質問情報を事前にマッチングして、事前マッチング結果を取得するステップと、
を含む請求項1に記載のインテリジェント対話方法。
【請求項3】
前記辞書ツリーに基づいて、前記質問情報を事前にマッチングして、事前マッチング結果を取得するステップが、
前記質問情報における1
つの文字を起点として、マッチングを続行できなくなるまで、前記辞書ツリーに基づいて逆方向にマッチング操作を行い、前記文字を起点とする最大マッチング文字列間隔、及び対応するマッチングレベルを取得するステップと、
前記質問情報の各文字に対して前記マッチング操作を完了した後、重複する文字列間隔リスト、及び対応するマッチングレベルリストを取得するステップと、
高から低の順に、各マッチングレベルの文字列間隔を重複排除して、前記各マッチングレベルの重複しない最大カバレッジ間隔リストを取得するステップと、
前記各マッチングレベルの重複しない最大カバレッジ間隔リストに基づいて、前記事前マッチング結果を取得するステップと、
を含む請求項2に記載のインテリジェント対話方法。
【請求項4】
前記質問情報、前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記質問情報に対応するSQLクエリステートメントを生成するステップが、
前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記各列属性の特徴ベクトルを生成するステップと、
前記質問情報に基づいて、前記質問情報の特徴ベクトルと前記質問情報の各字の特徴ベクトルを生成するステップと、
アテンションメカニズムを介して、前記質問情報の特徴ベクトルと前記各字の特徴ベクトルに基づいて、前記質問情報のグローバル特徴ベクトルを生成するステップと、
前記各字の特徴ベクトルを各列属性の特徴ベクトルとスプライシングして、対応するスプライシング特徴ベクトルを取得するステップと、
前記各列属性の特徴ベクトル、前記グローバル特徴ベクトル、及び前記スプライシング特徴ベクトルを、トレーニングされたSQLステートメント生成モデルに入力して、前記質問情報に対応するSQLクエリステートメントを取得するステップと、
を含む請求項1に記載のインテリジェント対話方法。
【請求項5】
前記アテンションメカニズムを介して、前記質問情報の特徴ベクトルと前記各字の特徴ベクトルに基づいて、前記質問情報のグローバル特徴ベクトルを生成するステップが、
アテンションメカニズムを介して、前記質問情報の特徴ベクトルと前記各字の特徴ベクトルに基づいて、対応するアテンション特徴ベクトルを生成するステップと、
前記質問情報の特徴ベクトルと前記アテンション特徴ベクトルとに基づいて、前記質問情報のグローバル特徴ベクトルを生成するステップと、
を含む請求項4に記載のインテリジェント対話方法。
【請求項6】
前記SQLステートメント生成モデルには、クエリフィールドサブタスク、クエリフィールド判断条件サブタスク、クエリフィールド判断条件シンボルサブタスク、クエリフィールド判断条件数サブタスク、クエリフィールド集約関数サブタスク、クエリ数サブタスク、質問判断条件数サブタスク、シーケンスラベリングサブタスク、及び判断条件間論理コネクタサブタスクが含まれる請求項4に記載のインテリジェント対話方法。
【請求項7】
前記各列属性の特徴ベクトル、前記グローバル特徴ベクトル、及び前記スプライシング特徴ベクトルを、トレーニングされたSQLステートメント生成モデルに入力して、前記質問情報に対応するSQLクエリステートメントを取得するステップが、
前記クエリフィールドサブタスクに基づいて前記各列属性の特徴ベクトルを予測し、前記各列属性の第1の予測結果を取得するステップと、
前記クエリフィールド判断条件サブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第2の予測結果を取得するステップと、
前記クエリフィールド判断条件シンボルサブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第3の予測結果を取得するステップと、
前記クエリフィールド判断条件数サブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第4の予測結果を取得するステップと、
前記クエリフィールド集約関数サブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第5の予測結果を取得するステップと、
前記クエリ数サブタスクに基づいて、前記グローバル特徴ベクトルを予測し、第6の予測結果を取得するステップと、
前記質問判断条件数サブタスクに基づいて、前記グローバル特徴ベクトルを予測し、第7の予測結果を取得するステップと、
前記判断条件間論理コネクタサブタスクに基づいて、前記グローバル特徴ベクトルを予測し、第8の予測結果を取得するステップと、
前記シーケンスラベリングサブタスクに基づいて、前記スプライシング特徴ベクトルを予測し、第9の予測結果を取得するステップと、
前記第1の予測結果、前記第2の予測結果、前記第3の予測結果、前記第4の予測結果、前記第5の予測結果、前記第6の予測結果、前記第7の予測結果、前記第8の予測結果、及び前記第9の予測結果に基づいて、前記質問情報に対応するSQLクエリステートメントを生成するステップと、を含む請求項6に記載のインテリジェント対話方法。
【請求項8】
前記第1の予測結果、前記第2の予測結果、前記第3の予測結果、前記第4の予測結果、前記第5の予測結果、前記第6の予測結果、前記第7の予測結果、前記第8の予測結果、及び前記第9の予測結果に基づいて、前記質問情報に対応するSQLクエリステートメントを生成するステップが、
前記第9の予測結果に基づいて、各列属性の候補クエリ属性値を決定するステップと、
前記第4の予測結果と前記第9の予測結果とに基づいて、前記各列属性の属性値の数を決定するステップと、
前記属性値の数と前記各列属性の候補クエリ属性値とに基づいて、前記各列属性のターゲットクエリ属性値を決定するステップと、
前記第1の予測結果と前記第6の予測結果とに基づいて、selectの数と対応するselect columnリストを決定するステップと、
前記第2の予測結果と前記第7の予測結果とに基づいて、whereの数と対応するwhere columnリストを決定するステップと、
前記第3の予測結果に基づいて、where column条件シンボルを決定するステップと、
前記第5の予測結果に基づいて、select column集約関数を決定するステップと、
前記第8の予測結果に基づいて、where column間の論理コネクタを決定するステップと、
前記各列属性のターゲットクエリ属性値、前記selectの数及び対応するselect columnリスト、前記whereの数及び対応するwhere columnリスト、前記where column条件シンボル、前記select column集約関数、及び前記where column間の論理コネクタに基づいて、前記質問情報に対応するSQLクエリステートメントを生成するステップと、
を含む請求項7に記載のインテリジェント対話方法。
【請求項9】
処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得するための事前マッチングモジュールであって、前記ターゲットテーブルには、複数の列属性と各列属性の属性値が含まれ、前記事前マッチング結果には、前記各列属性の列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及び前記質問情報とのマッチング度が最も高い属性値が含まれる事前マッチングモジュールと、
前記質問情報とのマッチング度が最も高い属性値に基づいて、前記質問情報から前記属性値とのマッチング度が最も高い単語セグメントを抽出するための抽出モジュールと、
前記各列属性の属性値から、前記単語セグメントに意味的に関連付けられたターゲット属性値を決定するための決定モジュールと、
前記質問情報、前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記質問情報に対応するSQLクエリステートメントを生成するための第1の生成モジュールと、
前記SQLクエリステートメントに基づいてデータベースを検索して、データベース検索の結果に基づいて応答ステートメントを生成するための第2の生成モジュールと、
を備えるインテリジェント対話装置。
【請求項10】
前記事前マッチングモジュールが、
前記ターゲットテーブルにおける前記複数の列属性と前記各列属性の属性値とに基づいて、前記ターゲットテーブルに対応する辞書ツリーを確立するための確立ユニットであって、前記辞書ツリーの各ノードには、マッチングタイプ、マッチングレベル、及び前記各ノードに対応する完全な文字列が含まれる確立ユニットと、
前記辞書ツリーに基づいて、前記質問情報を事前にマッチングして、事前マッチング結果を取得するためのマッチングユニットと、
を備える請求項9に記載のインテリジェント対話装置。
【請求項11】
前記マッチングユニットが、
前記質問情報における1
つの文字を起点として、マッチングを続行できなくなるまで、前記辞書ツリーに基づいて逆方向にマッチング操作を行い、前記文字を起点とする最大マッチング文字列間隔、及び対応するマッチングレベルを取得し、
前記質問情報の各文字に対して前記マッチング操作を完了した後、重複する文字列間隔リスト、及び対応するマッチングレベルリストを取得し、
高から低の順に、各マッチングレベルの文字列間隔を重複排除して、前記各マッチングレベルの重複しない最大カバレッジ間隔リストを取得し、
前記各マッチングレベルの重複しない最大カバレッジ間隔リストに基づいて、前記事前マッチング結果を取得する請求項10に記載のインテリジェント対話装置。
【請求項12】
前記第1の生成モジュールが、
前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記各列属性の特徴ベクトルを生成するための第1の生成ユニットと、
前記質問情報に基づいて、前記質問情報の特徴ベクトルと前記質問情報の各字の特徴ベクトルを生成するための第2の生成ユニットと、
アテンションメカニズムを介して、前記質問情報の特徴ベクトルと前記各字の特徴ベクトルに基づいて、前記質問情報のグローバル特徴ベクトルを生成するための第3の生成ユニットと、
前記各字の特徴ベクトルを各列属性の特徴ベクトルとスプライシングして、対応するスプライシング特徴ベクトルを取得するためのスプライシングユニットと、
前記各列属性の特徴ベクトル、前記グローバル特徴ベクトル、及び前記スプライシング特徴ベクトルを、トレーニングされたSQLステートメント生成モデルに入力して、前記質問情報に対応するSQLクエリステートメントを取得するための第4の生成ユニットと、
を備える請求項9に記載のインテリジェント対話装置。
【請求項13】
前記第3の生成ユニットが、
アテンションメカニズムを介して、前記質問情報の特徴ベクトルと前記各字の特徴ベクトルに基づいて、対応するアテンション特徴ベクトルを生成し、
前記質問情報の特徴ベクトルと前記アテンション特徴ベクトルとに基づいて、前記質問情報のグローバル特徴ベクトルを生成する請求項12に記載のインテリジェント対話装置。
【請求項14】
前記SQLステートメント生成モデルには、クエリフィールドサブタスク、クエリフィールド判断条件サブタスク、クエリフィールド判断条件シンボルサブタスク、クエリフィールド判断条件数サブタスク、クエリフィールド集約関数サブタスク、クエリ数サブタスク、質問判断条件数サブタスク、シーケンスラベリングサブタスク、及び判断条件間論理コネクタサブタスクが含まれる請求項12又は13に記載のインテリジェント対話装置。
【請求項15】
前記第4の生成ユニットが、
前記クエリフィールドサブタスクに基づいて前記各列属性の特徴ベクトルを予測し、前記各列属性の第1の予測結果を取得し、
前記クエリフィールド判断条件サブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第2の予測結果を取得し、
前記クエリフィールド判断条件シンボルサブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第3の予測結果を取得し、
前記クエリフィールド判断条件数サブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第4の予測結果を取得し、
前記クエリフィールド集約関数サブタスクに基づいて、前記各列属性の特徴ベクトルを予測し、前記各列属性の第5の予測結果を取得し、
前記クエリ数サブタスクに基づいて、前記グローバル特徴ベクトルを予測し、第6の予測結果を取得し、
前記質問判断条件数サブタスクに基づいて、前記グローバル特徴ベクトルを予測し、第7の予測結果を取得し、
前記判断条件間論理コネクタサブタスクに基づいて、前記グローバル特徴ベクトルを予測し、第8の予測結果を取得し、
前記シーケンスラベリングサブタスクに基づいて、前記スプライシング特徴ベクトルを予測し、第9の予測結果を取得し、
前記第1の予測結果、前記第2の予測結果、前記第3の予測結果、前記第4の予測結果、前記第5の予測結果、前記第6の予測結果、前記第7の予測結果、前記第8の予測結果、及び前記第9の予測結果に基づいて、前記質問情報に対応するSQLクエリステートメントを生成する請求項14に記載のインテリジェント対話装置。
【請求項16】
前記第4の生成ユニットが、
前記第9の予測結果に基づいて、各列属性の候補クエリ属性値を決定し、
前記第4の予測結果と前記第9の予測結果とに基づいて、前記各列属性の属性値の数を決定し、
前記属性値の数と前記各列属性の候補クエリ属性値とに基づいて、前記各列属性のターゲットクエリ属性値を決定し、
前記第1の予測結果と前記第6の予測結果とに基づいて、selectの数と対応するselect columnリストを決定し、
前記第2の予測結果と前記第7の予測結果とに基づいて、whereの数と対応するwhere columnリストを決定し、
前記第3の予測結果に基づいて、where column条件シンボルを決定し、
前記第5の予測結果に基づいて、select column集約関数を決定し、
前記第8の予測結果に基づいて、where column間の論理コネクタを決定し、
前記各列属性のターゲットクエリ属性値、前記selectの数及び対応するselect columnリスト、前記whereの数及び対応するwhere columnリスト、前記where column条件シンボル、前記select column集約関数、及び前記where column間の論理コネクタに基づいて、前記質問情報に対応するSQLクエリステートメントを生成する請求項15に記載のインテリジェント対話装置。
【請求項17】
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信可能に接続されたメモリと、を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行される命令が記憶されており、前記命令が、前記少なくとも1つのプロセッサが請求項1から8のいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。
【請求項18】
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令が、コンピュータに請求項1から8のいずれかに記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項19】
プロセッサによって実行される場合、請求項1から8のいずれか一項に記載の方法が実現されるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、人工知能の分野に関し、特に自然言語処理及び深層学習などの分野に関し、特にインテリジェント対話方法、装置、電子機器及び記憶媒体に関し、具体的にはインテリジェント対話シナリオに適用可能である。
【背景技術】
【0002】
テーブルの質問応答は、フォームのコンテンツに基づいて質問を行い、質問の答えを得るテクノロジである。ここで、このテクノロジには、テーブルデータをデータベースにインポートするステップと、自然言語をSQLステートメントに解析するステップ(このプロセスはNL2SQLと呼ぶことができる)と、SQLステートメントを使用してデータベースを検索するステップと、データベースの検索結果に基づいて応答ステートメントを生成するステップとを含む。ここで、コアステップはNL2SQLである。
【0003】
NL2SQLが直面する最大の課題の1つは、列名と属性値の一般化である。実際のビジネスシナリオでは、多くのユーザがテーブルの情報を理解していないため、ユーザが提示する質問情報がテーブルの列名または属性値と完全にマッチングすることは困難であり、SQL解析に失敗し、データベースの検索結果が不十分になり、インテリジェント対話の効果が悪くなる。
【発明の概要】
【0004】
本開示は、インテリジェント対話シナリオで使用可能なインテリジェント対話方法、装置、電子機器及び記憶媒体を提供する。
【0005】
本開示の第1の態様によれば、処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得するステップであって、前記ターゲットテーブルには、複数の列属性と各列属性の属性値が含まれ、前記事前マッチング結果には、前記各列属性の列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及び前記質問情報とのマッチング度が最も高い属性値が含まれるステップと、前記質問情報とのマッチング度が最も高い属性値に基づいて、前記質問情報から前記属性値とのマッチング度が最も高い単語セグメントを抽出するステップと、前記各列属性の属性値から、前記単語セグメントに意味的に関連付けられたターゲット属性値を決定するステップと、前記質問情報、前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記質問情報に対応するSQLクエリステートメントを生成するステップと、前記SQLクエリステートメントに基づいてデータベースを検索して、データベース検索の結果に基づいて応答ステートメントを生成するステップと、を含むインテリジェント対話方法を提供する。
【0006】
本開示の第2の態様によれば、処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得するための事前マッチングモジュールであって、前記ターゲットテーブルには、複数の列属性と各列属性の属性値が含まれ、前記事前マッチング結果には、前記各列属性の列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及び前記質問情報とのマッチング度が最も高い属性値が含まれる事前マッチングモジュールと、前記質問情報とのマッチング度が最も高い属性値に基づいて、前記質問情報から前記属性値とのマッチング度が最も高い単語セグメントを抽出するための抽出モジュールと、前記各列属性の属性値から、前記単語セグメントに意味的に関連付けられたターゲット属性値を決定するための決定モジュールと、前記質問情報、前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記質問情報に対応するSQLクエリステートメントを生成するための第1の生成モジュールと、前記SQLクエリステートメントに基づいてデータベースを検索して、データベース検索の結果に基づいて応答ステートメントを生成するための第2の生成モジュールと、を備えるインテリジェント対話装置を提供する。
【0007】
本開示の第3の態様によれば、電子機器を提供し、該電子機器は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されたメモリと、を備え、前記メモリには、前記少なくとも1つのプロセッサによって実行される命令が記憶されており、前記命令が、前記少なくとも1つのプロセッサが上記第1の態様に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
【0008】
本開示の第4の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令が、コンピュータに上記第1の態様に記載の方法を実行させる。
【0009】
本開示の第5の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、上記第1の態様に記載の方法が実現される。
【0010】
本開示の技術案によれば、NL2SQL技術が列名と属性値名の一般化能力を有することができ、これによって、ユーザの質問情報は、テーブル内の列名又は属性値名と完全にマッチングすることができ、SQL解析の成功率を高め、データベース検索の結果の精度を向上させ、インテリジェント対話の効果を改善することができる。
【0011】
なお、ここで記載されている内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していない。本出願の他の特徴は下記の明細書の記載によって理解しやすくなる。
【図面の簡単な説明】
【0012】
図面は、本出願をより良く理解するために使用され、本開示を限定するものではない。
【
図1】本開示の実施例により提供されるインテリジェント対話方法のフローチャートである。
【
図2】本開示の実施例の意味マッチングモデルの概略構成図である。
【
図3】本開示の実施例により提供される事前マッチング処理のフローチャートである。
【
図4】本開示の実施例の辞書ツリーの構造の例示的な図である。
【
図5】本開示の実施例により提供される事前マッチング結果の例示的な図である。
【
図6】本開示の実施例により提供されるSQLクエリステートメントの生成方法のフローチャートである。
【
図7】本開示の実施例により提供される別のSQLクエリステートメントの生成方法のフローチャートである。
【
図8】本開示の実施例によるSQLクエリステートメントの生成の概略図である。
【
図9】本開示の実施例により提供されるインテリジェント対話装置の構造ブロック図である。
【
図10】本開示の実施例により提供される別のインテリジェント対話装置の構造ブロック図である。
【
図11】本開示の実施例により提供される別のインテリジェント対話装置の構造ブロック図である。
【
図12】本開示の実施例により提供されるインテリジェント対話の方法を実現するための電子機器の構造ブロック図である。
【発明を実施するための形態】
【0013】
以下、図面と組み合わせて本出願の例示的な実施例を説明する。理解を容易にするために、その中には本発明の実施例の様々な詳細が含まれ、それらは単なる例示と見なされるべきである。したがって、当業者は、本発明の範囲および精神から逸脱することなく、本明細書に記載の実施例に様々な変更および修正を行うことができる。また、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能および構造の説明を省略する。
【0014】
なお、NL2SQLが直面する最大の課題の1つは、column(列名)とvalue(属性値)の一般化である。実際のビジネスシナリオでは、多くのユーザがテーブルの情報を理解していないため、ユーザが提示する質問情報(query)がテーブルのcolumnまたはvalueと完全にマッチングすることは困難であり、SQL解析に失敗する。例えば、ユーザの質問情報(query)は、「健康診断結果が合格した候補者は誰ですか」であり、テーブルの「健康診断結果」というcolumnのvalueは、「標準に達している」又は「標準に達していない」である。意味的には、「合格した」と「標準に達している」は同じ意味であるが、字面的には、完全にマッチングしないため、文字通りに解析することはできない。これは、従来技術におけるSQLステートメント生成モデルの効果はcolumnの命名の品質に依存しているためであり、columnの名がこの列の意味を十分に表すことができない場合、モデルは正しい予測ができないため、SQL解析に失敗して、データベース検索の結果が不十分になり、インテリジェント対話の効果が悪くなる。
【0015】
上記の問題に基づいて、本開示は、インテリジェント対話方法、装置、電子機器及び記憶媒体を提供する。本開示は、NL2SQL技術にcolumnとvalueの一般化能力を持たせることができるため、ユーザの質問情報をテーブルのcolumn又はvalueと完全にマッチングすることができ、SQL解析の成功率を高め、データベース検索の結果の精度を向上させ、インテリジェント対話の効果を改善することができる。具体的に、以下に図面を参照して本開示の実施例に係るインテリジェント対話方法、装置、電子機器及び記憶媒体を説明する。
【0016】
図1は、本開示の実施例により提供されるインテリジェント対話方法のフローチャートである。
図1に示すように、このインテリジェント対話方法は、以下のステップ101~105を含む。
【0017】
ステップ101では、処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得する。
【0018】
例えば、本開示の実施例に係るインテリジェント対話方法では、ユーザに質問入力インターフェースを提供できると仮定すると、このインターフェースを介してユーザによって入力された質問情報を取得し、ユーザによって入力されたこの質問情報を処理対象の質問情報とすることができる。なお、ユーザによって入力された質問情報の形式は音声形式又はテキスト形式であってもよい。ユーザによって入力された質問情報が音声形式である場合、ユーザによって入力されたこの音声に対して音声認識を行って、対応するテキスト情報に変換することができる。
【0019】
ここで、本実施例では、ターゲットテーブルには複数の列属性と各列属性の属性値が含まれる。なお、このターゲットテーブルはこの質問情報に対応しており、このターゲットテーブルは、後続のデータベース検索で使用されるデータベースにあるテーブルであってもよい。つまり、この質問情報に対応する答え情報は、このターゲットテーブルのテーブルコンテンツに基づいて取得されてもよい。
【0020】
このステップでは、処理対象の質問情報をターゲットテーブルに対応する辞書ツリーと事前にマッチングして、事前マッチング結果を取得することができる。ここで、事前マッチング結果には、各列属性の列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及び質問情報とのマッチング度が最も高い属性値が含まれてもよい。
【0021】
つまり、ターゲットテーブルに対応する辞書ツリーを使用してこの質問情報とマッチングし、このターゲットテーブルの列属性名と属性値から、列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及び質問情報とのマッチング度が最も高い属性値を取得する。
【0022】
なお、この辞書ツリーは、ターゲットテーブルのテーブルコンテンツに基づいて確立することができる。辞書ツリーの特徴は、長さmの文字列を検索する時間計算量がO(m)であり、そのクエリ性能はセット内の文字列の数とは関係がなく、テーブルのコンテンツが多い場合に検索及びマッチングを効率的に行うことができることである。
【0023】
ステップ102では、質問情報とのマッチング度が最も高い属性値に基づいて、質問情報から属性値とのマッチング度が最も高い単語セグメントを抽出する。
【0024】
例えば、質問情報が「ブランド名AAAAの車種は何ですか」であり、「ブランド名」という列名の属性値については、ターゲットテーブルに、「AAAAA」、「AABBCC」などがある場合、質問情報に基づいてターゲットテーブルの辞書ツリーと事前にマッチングして、質問情報とのマッチング度が最も高い属性値「AAAAA」を取得し、この質問情報とのマッチング度が最も高い属性値「AAAAA」に基づいて、この質問情報から、この属性値とのマッチング度が最も高い単語セグメント「AAAA」を抽出することができる。
【0025】
ステップ103では、各列属性の属性値から、単語セグメントに意味的に関連付けられたターゲット属性値を決定する。
【0026】
選択的に、テーブル情報を解析する場合、テーブル内の全ての属性値valueに対して、意味マッチングモデルによってベクトル表現を事前に計算してベクトルライブラリに記憶する。質問情報からこの単語セグメントを抽出する場合、この意味マッチングモデルによって、この単語セグメントのベクトル表現を計算し、この単語セグメントのベクトル表現を使用して、ベクトルライブラリで最も類似したベクトル及びそれに対応する属性値valueにインデックスを付け、検索された属性値を単語セグメントに意味的に関連付けられたターゲット属性値とすることができる。これにより、意味情報に基づいて、質問情報のセグメントを実際のvalueにマッピングすることにより、文字通りのマッチングが不正確な問題を解決することができる。
【0027】
なお、本開示の実施例では、この意味マッチングモデルは、事前にトレーニングされていてもよい。抽出された単語セグメントを意味に基づいてターゲットテーブルにおける実際の属性値valueにマッピングするために、本開示は、Sentence-BERT(文の類似度を迅速に計算できるシャムネットワーク)構造に基づいてこの意味マッチングモデルを構築する。例えば、
図2に示すように、それはこの意味マッチングモデルの概略構成図である。ここで、この意味マッチングモデルへの入力は2つのシーケンスであり、各シーケンスは、「[CLS] value [SEP]」として表される。2つのシーケンスをそれぞれ2つの重みが共有されているErnieモデルに入力して、value表現を取得する。2つのシーケンスのvalue tokenを平均プーリング(average pooling)処理した後、同じ次元の2つのベクトルuとvが取得され、計算されたベクトルuとvのコサイン距離は、2つのvalueの意味的類似度である。
【0028】
なお、この意味マッチングモデルのトレーニングに使用されるトレーニングサンプルは、正のサンプルと負のサンプルを含んでも良い。ここで、正のサンプルは、意味が同じで文字通りの偏差がある2つの単語であり、負のサンプルは、意味が異なる2つの単語である。正のサンプルは、シソーラスまたは単語の書き換えによって構築することができる。負のサンプルの構築は2つの段階に分けられる。第1の段階では、ランダムな選択によって負のサンプルが構築される。本開示は、正のサンプルと第1の段階で構築された負のサンプルを使用して、初期の意味マッチングモデルをトレーニングすることができる。第2の段階では、本開示は、初期の意味マッチングモデルを使用して類似度の高い負のサンプル、すなわち、困難な負のサンプルを選別する。本開示は、正のサンプルと困難な負のサンプルを使用して最終的な意味マッチングモデルをトレーニングすることができる。
【0029】
ステップ104では、質問情報、各列属性の列属性名、列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル及びターゲット属性値に基づいて、質問情報に対応するSQLクエリステートメントを生成する。
【0030】
本開示の実施例では、トレーニングされたSQLステートメント生成モデルを使用して、質問情報に対応するSQLクエリステートメントを生成することができる。例えば、質問情報、各列属性の列属性名、列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル及びターゲット属性値を入力としてスプライシングし、この入力シーケンスを対応するベクトル表現に変更し、この入力シーケンスに対応するベクトル表現をこのトレーニングされたSQLステートメント生成モデルに入力して、質問情報に対応するSQLクエリステートメントを生成することができる。
【0031】
ステップ105では、SQLクエリステートメントに基づいてデータベースを検索し、データベース検索の結果に基づいて応答ステートメントを生成する。
【0032】
選択的に、質問情報に対応するSQLクエリステートメントが取得された場合、このSQLクエリステートメントに基づいてデータベースを検索して、データベース検索の結果を取得し、このデータベース検索の結果及び対応する応答ステートメントテンプレートを使用して、対応する応答ステートメントを生成することができる。選択的に、この応答ステートメントは、音声放送、テキスト表示などの少なくとも1つの表示形式でユーザに提供される。
【0033】
本開示の実施例に係るインテリジェント対話方法では、質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果における質問情報とのマッチング度が最も高い属性値を使用して、この質問情報から単語セグメントを抽出し、この単語セグメントを使用して、この単語セグメントに意味的に関連付けられた実際の属性値名を決定し、事前マッチング結果における各列属性の列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、質問情報、及び実際の属性値名を使用して、この質問情報に対応するSQLクエリステートメントを生成することにより、SQL解析の成功率を大幅に高め、データベース検索の結果の精度を向上させ、インテリジェント対話の効果を改善することができる。
【0034】
なお、検索とマッチングの效率を向上させ、テーブル内の列属性のヒット率を向上させ、SQL解析の成功率をさらに向上させるために、ターゲットテーブルに対応する辞書ツリーを使用して、質問情報と事前にマッチングすることができる。選択的に、
図3に示すように、前記処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得する方法は、以下のステップ301~302を含むことができる。
【0035】
ステップ301では、ターゲットテーブルにおける複数の列属性と各列属性の属性値とに基づいて、ターゲットテーブルに対応する辞書ツリーを確立する。
【0036】
ここで、本開示の実施例では、この辞書ツリーの各ノードは、マッチングタイプ、マッチングレベル及び各ノードに対応する完全な文字列を含むことができる。一例として、前処理段階では、ターゲットテーブルのすべての列属性と各列属性の属性値を使用して辞書ツリーを構築することができる。ここで、各列属性と列属性の属性値はいずれも独立した辞書ツリーであり、ターゲットテーブルのすべての列属性と各列属性の属性値の各文字列に対して、異なる開始位置から最後までのサブ文字列を抽出し、これらのサブ文字列を対応する辞書ツリーに挿入し、辞書ツリーの各ノードのマッチングレベル及び配合タイプを求める。
【0037】
例えば、
図4に示すように、「品牌名称(日本語の意味:ブランド名)」の列属性のサブ文字列は、「品牌名称」、「牌名称」、「名称」、「称」を含み、サブ文字列が異なれば、元の文字列とのマッチング度も異なる(例えば、「品牌名称」は、元の文字列と完全にマッチングし、「称」は、1
つの文字しかマッチングしない)。これらのサブ文字列を「品牌名称」に対応する辞書ツリーに挿入し、辞書ツリーの各ノードのマッチングレベル及びマッチングタイプ(列属性名又は属性値)を求める。ここで、異なる文字列と元の文字列とのマッチング度に基づいて、マッチングレベルが6つのレベルに分けられ、0は、マッチングしないことを意味し、5は、完全にマッチングすることを意味し、マッチング度は1から4に増加する。ここで、
図4に示すように、この辞書ツリーの各ノードはマッチングタイプ、マッチングレベル、及び各ノードに対応する完全な文字列を含むことができる。
【0038】
ステップ302では、辞書ツリーに基づいて、質問情報を事前にマッチングして、事前マッチング結果を取得する。
【0039】
一実施形態では、質問情報における1つの文字を起点として、マッチングを続行できなくなるまで、辞書ツリーに従って逆方向にマッチング操作を行い、文字を起点とする最大マッチング文字列間隔、及び対応するマッチングレベルを取得し、質問情報における各文字のマッチング操作を完了した後、重複する文字列間隔リスト、及び対応するマッチングレベルリストを取得し、高から低の順に、各マッチングレベルの文字列間隔を重複排除して、各マッチングレベルの重複しない最大カバレッジ間隔リストを取得し、各マッチングレベルの重複しない最大カバレッジ間隔リストに基づいて、事前マッチング結果を取得する。
【0040】
例えば、辞書ツリーを使用して、質問情報queryの最大マッチングを行う。queryにおける1
つの文字を起点として、マッチングを続行できなくなるまで、辞書ツリーに従って逆方向にマッチングして、この文字を起点とする最大マッチング文字列間隔、及び対応するマッチングレベルを取得することができる。queryにおける各文字に対して上記のマッチング操作を完了した後、重複する文字列間隔リスト、及び対応するマッチングレベルリストを取得することができる。高から低の順に、各マッチングレベルの文字列間隔を重複排除して、このマッチングレベルの重複しない最大カバレッジ間隔リストを取得することができる。高いマッチングレベルが占有している間隔に対して、低いマッチングレベルは占有できない。最後に、重複しない文字列間隔リストと対応するマッチングレベルリストを取得することができる。例えば、
図5に示すように、質問情報が「AAA的价格和品牌名(日本語の意味:AAAの価格とブランド名)」であることを例として、この質問情報を対応するターゲットテーブルの辞書ツリーと事前にマッチングした後、事前マッチング結果を取得し、ここで、この事前マッチング結果には、各列の最も高いcolumnマッチングレベル、最も高いvalueマッチングレベル、queryとのマッチング度が最も高いvalueが含まれることができる。
【0041】
これから分かるように、ターゲットテーブルのテーブルコンテンツを使用して、対応する辞書ツリーを確立し、辞書ツリーの特徴は、長さmの文字列を検索する時間計算量がO(m)であり、そのクエリ性能はセット内の文字列の数とは関係がなく、テーブルのコンテンツが多い場合に検索及びマッチングを効率的に行うことができることである。この辞書ツリーを使用して、質問と事前にマッチングすることにより、検索とマッチングの效率を向上させ、テーブル内の列属性のヒット率を向上させ、SQL解析の成功率をさらに向上させることができる。
【0042】
なお、トレーニングされたSQLステートメント生成モデルを使用して質問情報に対応するSQLクエリステートメントを生成することができる。例えば、質問情報とテーブル情報とのマッチング特徴をモデルに組み込んで、モデルの表現能力を高めることができる。また例えば、各例のマッチング度が最も高いvalueをモデルに追加することで、モデルは、columnの名前付けに依存して各列のSQL操作を予測するだけでなく、valueの情報も参照することができ、columnの名が欠落している場合でも、ある程度の精度が保証される。選択的に、
図6に示すように、前記質問情報、各列属性の列属性名、列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル及びターゲット属性値に基づいて、質問情報に対応するSQLクエリステートメントを生成する方法は、以下のステップ601~605を含むことができる。
【0043】
ステップ601では、各列属性の列属性名、列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及びターゲット属性値に基づいて、各列属性の特徴ベクトルを生成する。
【0044】
選択的に、各列属性に対して、この列属性の列属性名、列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及びターゲット属性値をスプライシングして、Ernieモデルを使用して、スプライシングされたシーケンスをベクトル表現に変換し、即ち、スプライシングされた各列属性シーケンスをこのErnieモデルに入力し、スプライシングされた各列属性シーケンスに対応する特徴ベクトル表現を取得し、この特徴ベクトル表現は、各列属性の特徴ベクトルである。
【0045】
ステップ602では、質問情報に基づいて、質問情報の特徴ベクトルと質問情報における各字の特徴ベクトルを生成する。
【0046】
選択的に、質問情報をErnieモデルに入力して、質問情報の特徴ベクトルと質問情報における各字の特徴ベクトルを取得する。
【0047】
ステップ603では、アテンションメカニズムを介して、質問情報の特徴ベクトルと各字の特徴ベクトルとに基づいて、質問情報のグローバル特徴ベクトルを生成する。
【0048】
選択的に、アテンションメカニズムを介して、質問情報の特徴ベクトルと各字の特徴ベクトルとに基づいて、対応するアテンション特徴ベクトルを生成し、質問情報の特徴ベクトルとアテンション特徴ベクトルとに基づいて、質問情報のグローバル特徴ベクトルを生成する。
【0049】
ステップ604では、各字の特徴ベクトルをそれぞれ各列属性の特徴ベクトルとスプライシングして、対応するスプライシング特徴ベクトルを取得する。
【0050】
ステップ605では、各列属性の特徴ベクトル、グローバル特徴ベクトル及びスプライシング特徴ベクトルを、トレーニングされたSQLステートメント生成モデルに入力して、質問情報に対応するSQLクエリステートメントを取得する。
【0051】
本開示のいくつかの実施例では、SQLステートメント生成モデルは、クエリフィールドサブタスク、クエリフィールド判断条件サブタスク、クエリフィールド判断条件シンボルサブタスク、クエリフィールド判断条件数サブタスク、クエリフィールド集約関数サブタスク、クエリ数サブタスク、質問判断条件数サブタスク、シーケンスラベリングサブタスク、及び判断条件間論理コネクタサブタスクを含む。一例として、このクエリフィールドサブタスクはS-COLサブタスクとすることができ、このS-COLサブタスクの役割は、このcolumnがselect columnであるか否かである。
【0052】
このクエリフィールド判断条件サブタスクは、W-COLサブタスクとすることができ、このW-COLサブタスクの役割は、このcolumnがwhere columnであるか否かである。
【0053】
このクエリフィールド判断条件シンボルサブタスクは、W-OPサブタスクとすることができ、このW-OPサブタスクの役割は、where columnの条件シンボルである。
【0054】
このクエリフィールド判断条件数サブタスクは、W-NUM-colサブタスクとすることができ、このW-NUM-colサブタスクの役割は、where columnに対応するwhere条件の数である。
【0055】
このクエリフィールド集約関数サブタスクは、W-AGGサブタスクとすることができ、このW-AGGサブタスクの役割は、select columnの集約関数である。
【0056】
このクエリ数サブタスクは、S-NUMサブタスクとすることができ、このS-NUMサブタスクの役割は、selectの数である。
【0057】
この質問判断条件数サブタスクは、W-NUM-allサブタスクとすることができ、このW-NUM-allサブタスクの役割は、クエリ数サブタスクのwhere条件の数である。
【0058】
このシーケンスラベリングサブタスクは、W-VAL-tagサブタスクとすることができ、このW-VAL-tagサブタスクの役割は、このquery tokenがwhere columnのvalueであるか否かである。
【0059】
この判断条件間論理コネクタサブタスクは、CONNサブタスクとすることができ、このCONNサブタスクの役割は、where条件間の論理コネクタである。
【0060】
本実施例では、各列属性の特徴ベクトル、グローバル特徴ベクトル及びスプライシング特徴ベクトルを、トレーニングされたSQLステートメント生成モデルに入力することができる。SQLステートメント生成モデルにおける各サブタスクは、対応する特徴ベクトルを使用して予測を行って、各サブタスクに対応する予測結果を取得し、各サブタスクに対応する予測結果に基づいて質問情報に対応するSQLクエリステートメントを生成することができる。
【0061】
一実施形態では、
図7に示すように、前記各列属性の特徴ベクトル、グローバル特徴ベクトル及びスプライシング特徴ベクトルを、トレーニングされたSQLステートメント生成モデルに入力して、質問情報に対応するSQLクエリステートメントを取得する方法は、以下のステップ701~708を含むことができる。
【0062】
ステップ701では、クエリフィールドサブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第1の予測結果を取得する。
【0063】
ステップ702では、クエリフィールド判断条件サブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第2の予測結果を取得する。
【0064】
ステップ703では、クエリフィールド判断条件シンボルサブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第3の予測結果を取得する。
【0065】
ステップ704では、クエリフィールド判断条件数サブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第4の予測結果を取得する。
【0066】
ステップ705では、クエリフィールド集約関数サブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第5の予測結果を取得する。
【0067】
ステップ706では、クエリ数サブタスクに基づいてグローバル特徴ベクトルを予測し、第6の予測結果を取得する。
【0068】
ステップ707では、質問判断条件数サブタスクに基づいてグローバル特徴ベクトルを予測し、第7の予測結果を取得する。
【0069】
ステップ708では、判断条件間論理コネクタサブタスクに基づいてグローバル特徴ベクトルを予測し、第8の予測結果を取得する。
【0070】
ここで、第8の予測結果から、各列に対するquery tokenのラベリング確率を取得することができ、ラベリング確率が0.5を超える連続した文字列をこの列の候補属性値として抽出し、平均確率を属性値のスコアとすることができる。
【0071】
なお、本開示の実施例では、第3の予測結果から、各列の異なるvalueの数に対応する確率を取得することができる。次の式に基づいて各列のvalueの数を決定することができる。
【数1】
【0072】
ここで、nは、この列の列属性の数を表し、scoreiは、i番目に大きい列属性スコアであり、pnは、この列の列属性の数がnである確率であり、εは、式の正当性を保証するための小さな正の数であり、式は、実際には、判断条件間論理コネクタサブタスクとクエリフィールド判断条件シンボルサブタスクとの2つのサブタスクの合計確率が最も高い列属性の数を選択するものである。各列の列属性の数nが得られた後、各列の候補列属性リストから、スコアが最大のn個の列属性をこの列の列属性として選択する。
【0073】
ステップ709では、シーケンスラベリングサブタスクに基づいてスプライシング特徴ベクトルを予測し、第9の予測結果を取得する。
【0074】
ステップ710では、第1の予測結果、第2の予測結果、第3の予測結果、第4の予測結果、第5の予測結果、第6の予測結果、第7の予測結果、第8の予測結果及び第9の予測結果に基づいて、質問情報に対応するSQLクエリステートメントを生成する。
【0075】
選択的に、第9の予測結果に基づいて、各列属性の候補クエリ属性値を決定し、第4の予測結果と第9の予測結果とに基づいて、各列属性の属性値の数を決定し、属性値の数と各列属性の候補クエリ属性値とに基づいて、各列属性のターゲットクエリ属性値を決定し、第1の予測結果と第6の予測結果とに基づいて、selectの数と対応するselect columnリストを決定し、第2の予測結果と第7の予測結果とに基づいて、whereの数と対応するwhere columnリストを決定し、第3の予測結果に基づいて、where column条件シンボルを決定し、第5の予測結果に基づいて、select column集約関数を決定し、第8の予測結果に基づいて、where column間の論理コネクタを決定し、各列属性のターゲットクエリ属性値、selectの数及び対応するselect columnリスト、whereの数及び対応するwhere columnリスト、where column条件シンボル、select column集約関数及びwhere column間の論理コネクタに基づいて、質問情報に対応するSQLクエリステートメントを生成する。
【0076】
例えば、
図8に示すように、本開示は、Ernieモデリングに基づいて、query(すなわち、上記の質問情報)と各列のcolumn(すなわち、上記の列属性名)、最も高いcolumnマッチングレベル(すなわち、上記の列属性名の最も高いマッチングレベル)、最も高いvalueマッチングレベル(すなわち、上記の属性値の最も高いマッチングレベル)、マッチング度が最も高いvalue(すなわち、上記のターゲット属性値)を入力としてスプライシングする。具体的な入力シーケンスは、以下のとおりである。
[CLS] query [SEP] [C] 、 、 ... [V] 、 、 ...[CM] [VM] [SEP] [C] 、 、 ... [V] 、 、 ...[CM] [VM] [SEP] ... [SEP]。
【0077】
ここで、[C]はi番目の列のcolumnの特殊記号であり、 ... はi番目のcolumn tokenであり、[V]はi番目の列のvalueの特殊記号であり、...はi番目の列におけるqueryとのマッチング度が最も高いvalue tokenであり、[CM]は、i番目の列の最も高いcolumnマッチングレベルから変換された特殊記号であり、[VM]は、i番目の列の最も高いvalueマッチングレベルから変換された特殊記号である。Queryとcolumnの間、columnとcolumnの間はいずれも特殊記号[SEP]で区切られている。
【0078】
入力シーケンスの異なる部分は、異なるタイプの埋め込み(type embedding)を使用して区別され、ここで、queryはカテゴリ0であり、文字列タイプのcolumnはカテゴリ1であり、数値のcolumnはカテゴリ2であり、valueはカテゴリ3であり、特殊記号[CM]及び[VM]はカテゴリ4であり、特殊記号[SEP]及び[PAD]はカテゴリ5である。異なるtype embeddingは、モデルが入力シーケンスの異なる部分を区別するのに役立つ。
【0079】
[CLS](すなわち、上記のグローバル特徴ベクトル)へのquery token(すなわち、上記の質問情報における各字)のリソース集中型スプライシング(attentive pooling)を[CLS]とスプライシングしてquery表現とする。各列の列属性名([C])、ターゲット属性値([V])、列属性名の最も高いマッチングレベル([CM])、及び属性値の最も高いマッチングレベル([VM])をこの列の表現としてスプライシングする。query tokenと各列の[C]、[V]、[CM]、[VM]を、この列へのtokenのvalue表現としてスプライシングする。
【0080】
なお、本開示の実施例では、Query表現は、W-NUM-allと、S_NUMと、CONNとの3つのサブタスクを予測するために使用され、これらの3つのサブタスクは全てマルチ分類タスクであり、クロスエントロピー損失を使用してトレーニングされる。各列の表現は、S-COLと、W-COLと、W-OPと、W-AGGと、W-NUM-colとの5つのサブタスクを予測するために使用され、ここで、W-OP、W-AGG、及びW-NUM-colは、クロスエントロピー損失を使用するマルチ分類タスクであり、S-COLとW-COLは、KLダイバージェンス(相対エントロピー)を損失として使用するソートタスクとして定義され、これによって、すべての列を同時に最適化することができる。各列のvalue表現は、W-VAL-tagサブタスクを予測するために使用され、ここで、このサブタスクは、クロスエントロピー損失を使用する0/1バイナリシーケンスラベリングタスクとして定義することができる。
【0081】
これから分かるように、本開示は、queryとテーブル情報のマッチング特徴をモデルに十分に組み込むことができ、モデルの表現能力を高めることができ、各例のマッチング度が最も高いvalueをモデルに追加することで、モデルは、columnの名前付けに依存して各列のSQL操作を予測するだけでなく、valueの情報も参照することができ、columnの名が欠落している場合でも、ある程度の精度が保証される。また、本開示は、valueの抽出方法を改善し、単一のcolumnの複数のvalueを同時に抽取することができる。なお、本開示は、意味検索の能力を有し、意味情報に基づいてqueryセグメントを実際のvalueにマッチングすることができ、字面的にマッチングが不正確な問題を解決する。
【0082】
上記実施例を実現するために、本開示は、インテリジェント対話装置をさらに提供する。
【0083】
図9は、本開示の実施例により提供されるインテリジェント対話装置の構造ブロック図である。
図9に示すように、このインテリジェント対話装置は、事前マッチングモジュール910、抽出モジュール920、決定モジュール930、第1の生成モジュール940、及び第2の生成モジュール950を備える。
【0084】
ここで、事前マッチングモジュール910は、処理対象の質問情報をターゲットテーブルのテーブルコンテンツと事前にマッチングして、事前マッチング結果を取得し、ここで、ターゲットテーブルには複数の列属性と各列属性の属性値が含まれ、事前マッチング結果には、各列属性の列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル、及び質問情報とのマッチング度が最も高い属性値が含まれる。
【0085】
抽出モジュール920は、質問情報とのマッチング度が最も高い属性値に基づいて、質問情報から属性値とのマッチング度が最も高い単語セグメントを抽出する。
【0086】
決定モジュール930は、各列属性の属性値から、単語セグメントに意味的に関連付けられたターゲット属性値を決定する。
【0087】
第1の生成モジュール940は、質問情報、各列属性の列属性名、列属性名の最も高いマッチングレベル、属性値の最も高いマッチングレベル及びターゲット属性値に基づいて、質問情報に対応するSQLクエリステートメントを生成する。
【0088】
第2の生成モジュール950は、SQLクエリステートメントに基づいてデータベースを検索し、データベース検索の結果に基づいて応答ステートメントを生成する。
【0089】
本出願のいくつかの実施例では、
図10に示すように、
図10は本開示の別の実施例によるインテリジェント対話装置の構造ブロック図であり、このインテリジェント対話装置の事前マッチングモジュール1010は、確立ユニット1011及びマッチングユニット1012を備える。
【0090】
ここで、確立ユニット1011は、前記ターゲットテーブルにおける前記複数の列属性と前記各列属性の属性値とに基づいて、前記ターゲットテーブルに対応する辞書ツリーを確立し、ここで、前記辞書ツリーの各ノードには、マッチングタイプ、マッチングレベル、及び前記各ノードに対応する完全な文字列が含まれる。
【0091】
マッチングユニット1012は、前記辞書ツリーに基づいて、前記質問情報を事前にマッチングして、事前マッチング結果を取得する。一実施形態では、マッチングユニット1012は、前記質問情報における1つの文字を起点として、マッチングを続行できなくなるまで、前記辞書ツリーに従って逆方向にマッチング操作を行って、前記文字を起点とする最大マッチング文字列間隔、及び対応するマッチングレベルを取得し、前記質問情報の各文字に対して前記マッチング操作を完了した後、重複する文字列間隔リスト、及び対応するマッチングレベルリストを取得し、高から低の順に、各マッチングレベルの文字列間隔を重複排除して、前記各マッチングレベルの重複しない最大カバレッジ間隔リストを取得し、前記各マッチングレベルの重複しない最大カバレッジ間隔リストに基づいて、前記事前マッチング結果を取得する。
【0092】
ここで、
図10の1020~1050は、
図9の920~950と同じ機能と構造を有する。
【0093】
本出願のいくつかの実施例では、
図11に示すように、
図11は、本開示の別の実施例によるインテリジェント対話装置の構造ブロック図であり、このインテリジェント対話装置では、第1の生成モジュール1140は、第1の生成ユニット1141、第2の生成ユニット1142、第3の生成ユニット1143、スプライシングユニット1144、及び第4の生成ユニット1145を備える。
【0094】
ここで、第1の生成ユニット1141は、前記各列属性の列属性名、前記列属性名の最も高いマッチングレベル、前記属性値の最も高いマッチングレベル、及び前記ターゲット属性値に基づいて、前記各列属性の特徴ベクトルを生成する。
【0095】
第2の生成ユニット1142は、前記質問情報に基づいて、前記質問情報の特徴ベクトルと前記質問情報の各字の特徴ベクトルを生成する。
【0096】
第3の生成ユニット1143は、アテンションメカニズムを介して、前記質問情報の特徴ベクトルと前記各字の特徴ベクトルに基づいて、前記質問情報のグローバル特徴ベクトルを生成する。一実施形態では、第3の生成ユニット1143は、具体的には、アテンションメカニズムを介して、前記質問情報の特徴ベクトルと前記各字の特徴ベクトルに基づいて、対応するアテンション特徴ベクトルを生成し、前記質問情報の特徴ベクトルと前記アテンション特徴ベクトルとに基づいて、前記質問情報のグローバル特徴ベクトルを生成する。
【0097】
スプライシングユニット1144は、前記各字の特徴ベクトルをそれぞれ各列属性の特徴ベクトルとスプライシングして、対応するスプライシング特徴ベクトルを取得する。
【0098】
第4の生成ユニット1145は、前記各列属性の特徴ベクトル、前記グローバル特徴ベクトル、及び前記スプライシング特徴ベクトルを、トレーニングされたSQLステートメント生成モデルに入力して、前記質問情報に対応するSQLクエリステートメントを取得する。ここで、SQLステートメント生成モデルは、クエリフィールドサブタスク、クエリフィールド判断条件サブタスク、クエリフィールド判断条件シンボルサブタスク、クエリフィールド判断条件数サブタスク、クエリフィールド集約関数サブタスク、クエリ数サブタスク、質問判断条件数サブタスク、シーケンスラベリングサブタスク、及び判断条件間論理コネクタサブタスクを含む。
【0099】
一実施形態では、第4の生成ユニット1145は、具体的には、クエリフィールドサブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第1の予測結果を取得し、クエリフィールド判断条件サブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第2の予測結果を取得し、クエリフィールド判断条件シンボルサブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第3の予測結果を取得し、クエリフィールド判断条件数サブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第4の予測結果を取得し、クエリフィールド集約関数サブタスクに基づいて各列属性の特徴ベクトルを予測し、各列属性の第5の予測結果を取得し、クエリ数サブタスクに基づいてグローバル特徴ベクトルを予測し、第6の予測結果を取得し、質問判断条件数サブタスクに基づいてグローバル特徴ベクトルを予測し、第7の予測結果を取得し、判断条件間論理コネクタサブタスクに基づいてグローバル特徴ベクトルを予測し、第8の予測結果を取得し、シーケンスラベリングサブタスクに基づいてスプライシング特徴ベクトルを予測し、第9の予測結果を取得し、第1の予測結果、第2の予測結果、第3の予測結果、第4の予測結果、第5の予測結果、第6の予測結果、第7の予測結果、第8の予測結果及び第9の予測結果に基づいて、質問情報に対応するSQLクエリステートメントを生成する。
【0100】
選択的に、本開示の実施例では、第4の生成ユニット1145は、第1の予測結果、第2の予測結果、第3の予測結果、第4の予測結果、第5の予測結果、第6の予測結果、第7の予測結果、第8の予測結果及び第9の予測結果に基づいて、質問情報に対応するSQLクエリステートメントを生成する方法は以下のとおりである。第9の予測結果に基づいて、各列属性の候補クエリ属性値を決定し、第4の予測結果と第9の予測結果とに基づいて、各列属性の属性値の数を決定し、属性値の数と各列属性の候補クエリ属性値とに基づいて、各列属性のターゲットクエリ属性値を決定し、第1の予測結果と第6の予測結果とに基づいて、selectの数と対応するselect columnリストを決定し、第2の予測結果と第7の予測結果とに基づいて、whereの数と対応するwhere columnリストを決定し、第3の予測結果に基づいて、where column条件シンボルを決定し、第5の予測結果に基づいてselect column集約関数を決定し、第8の予測結果に基づいてwhere column間の論理コネクタを決定し、各列属性のターゲットクエリ属性値、selectの数及び対応するselect columnリスト、whereの数及び対応するwhere columnリスト、where column条件シンボル、select column集約関数及びwhere column間の論理コネクタに基づいて、質問情報に対応するSQLクエリステートメントを生成する。
【0101】
ここで、
図11の1110~1150は、
図10の1010~1050と同じ機能と構造を有する。
【0102】
上記の実施例の装置に関して、その中の各モジュールが動作を実行する具体的な方式は、方法の実施例において詳細に説明されており、ここでは詳細に説明されていない。
【0103】
本開示の実施例によれば、本開示は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
本開示の実施例によれば、本開示は、コンピュータプログラムをさらに提供し、前記コンピュータプログラムはプロセッサによって実行される場合、本開示により提供されるインテリジェント対話方法が実現される。
【0104】
図12に示すように、本開示の実施例によるインテリジェント対話の方法を実現するための電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及びその他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルアシスタント、セルラー電話、スマートフォン、ウェアラブルデバイス、及びその他の類似のコンピュータデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本開示に記載されているコンポーネント、それらの接続関係、及び機能は例示的なものに過ぎず、本明細書の説明及び/又は要求される本開示の実現を制限することを意図したものではない。
【0105】
図12に示すように、該電子機器は、1又は複数のプロセッサ1201と、メモリ1202と、高速インターフェース及び低速インターフェースを備える、各コンポーネントを接続するためのインターフェースとを備える。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボード上に実装されてもよいし、必要に応じて他の形態で実装されてもよい。プロセッサは、外部入力/出力装置(例えば、インターフェースに結合されたディスプレイデバイスなど)にGUIのグラフィカル情報を表示するためにメモリ内又はメモリ上に記憶されている命令を含む、電子機器内で実行される命令を処理することができる。他の実施形態では、複数のプロセッサ及び/又は複数のバスが、必要に応じて、複数のメモリとともに使用されることができる。同様に、複数の電子機器を接続することができ、各機器は、一部の必要な動作(例えば、サーバアレイ、1グループのブレードサーバ、マルチプロセッサシステムとする)を提供することができる。
図12では、1つのプロセッサ1201を例に挙げている。
【0106】
メモリ1202は、本開示により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。ここで、前記メモリには、少なくとも1つのプロセッサが本開示により提供されるインテリジェント対話方法を実行するように、少なくとも1つのプロセッサによって実行される命令が格納されている。本開示の非一時的なコンピュータ読み取り可能な記憶媒体には、本開示によって提供されるインテリジェント対話方法をコンピュータに実行させるためのコンピュータ命令が記憶されている。
【0107】
メモリ1202は、非一時的なコンピュータ読み取り可能な記憶媒体として、本開示の実施例におけるインテリジェント対話方法に対応するプログラム命令/モジュール(例えば、
図9に示す事前マッチングモジュール901、抽出モジュール902及び決定モジュール903)のような、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュールなどを記憶するために使用される。プロセッサ1201は、メモリ1202に格納された非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーションやデータ処理を実行し、即ち、上記方法の実施例におけるインテリジェント対話方法を実現する。
【0108】
メモリ1202は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶することができるプログラム記憶領域と、インテリジェント対話方法を実現するための電子機器の使用に応じて作成されたデータなどを記憶することができるデータ記憶領域とを含む。また、メモリ1202は、高速ランダムアクセスメモリを備えてもよく、また、少なくとも1つの磁気ディスクメモリデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートメモリデバイスなどの非一時的なメモリを備えてもよい。一部の実施形態では、メモリ1202は、プロセッサ1201に対して遠隔に配置されたメモリを選択的に備えることができる。これらの遠隔メモリは、ネットワークを介してインテリジェント対話方法に係る電子機器に接続されることができる。上記ネットワークの例としては、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びこれらの組み合わせを含むが、これらに限定されない。
【0109】
インテリジェント対話方法を実現するための電子機器は、入力装置1203及び出力装置1204を備える。プロセッサ1201、メモリ1202、入力装置1203及び出力装置1204は、バス又は他の方式で接続することができ、
図12では、バスを介して接続される例が示される。
【0110】
入力装置1203は、入力された数字又は文字情報を受信し、インテリジェント対話方法の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置1204は、ディスプレイ装置、補助照明装置(例えば、LED)、及び触覚フィードバック装置(例えば、振動モータ)などを備えることができる。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むが、これらに限定されない。一部の実施形態では、表示装置は、タッチスクリーンであってもよい。
【0111】
本明細書に記載されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施され、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを備えるプログラム可能なシステムで実行及び/又は解釈されすることができ、当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置にデータ及び命令を送信することができる。
【0112】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、これらのコンピュータプログラムは、高レベルのプロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/機械言語で実現される。本明細書で使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、プログラマブルプロセッサに機械命令及び/又はデータを提供するための任意のコンピュータプログラム製品、デバイス、及び/又は装置(例えば、磁気ディスク、光学ディスク、メモリ、プログラム可能論理デバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
【0113】
ユーザとのインタラクションを提供するために、本明細書に記載されたシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置を使用して、ユーザとのインタラクションを提供してもよい。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよい。ユーザからの入力は、任意の形態(音響入力と、音声入力と、触覚入力とを含む)で受信されることができる。
【0114】
本明細書に記載のシステム及び技術は、バックエンドコンポーネントを備えるコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを備えるコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを備えるコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、又はそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントの任意の組み合わせを備えるコンピューティングシステムで実施されることができる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって互いに接続されることができる。通信ネットワークとしては、例えば、ローカルエリアネットワーク(LAN) と、ワイドエリアネットワーク(WAN) と、インターネットと、ブロックチェンネットワークとを含む。
【0115】
コンピュータシステムは、クライアント及びサーバを備えることができる。クライアント及びサーバは、一般に、互いから離れており、通常、通信ネットワークを介してインタラクションする。クライアントとサーバの関係は、対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによって生成される。サーバは、クラウドサーバであってよく、クラウドコンピューティングサーバ又はクラウドホストとも称され、クラウドコンピューティングサービスアーキテクチャにおけるホスト製品の1つであり、従来の物理ホスト及びVPSサービス(Virtual Private Server、又は「VPS」と略称する)における管理困難性が高く、トラフィック拡張性が低いという欠点を解決する。サーバは分散システムのサーバでも、ブロックチェーンを組み合わせたサーバでもよい。
【0116】
本開示の実施例の技術手段によれば、NL2SQL技術に列名と属性値名の一般化能力を持たせることができるため、ユーザの質問情報をテーブルにおける列名又は属性値名と完全にマッチングすることができ、SQL解析の成功率を高め、データベース検索の結果の精度を向上させ、インテリジェント対話の効果を改善することができる。
【0117】
上記に示された様々な形態のフローを使用して、ステップを並べ替え、追加、又は削除することができる。例えば、本開示に記載された各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよく、本開示に開示された技術的解決手段の所望の結果を実現できれば、本明細書では限定しない。
【0118】
上述した具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者にとって、設計の要件や他の要素に基づいて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことができることは、明らかである。本開示の精神と原則内で行われる任意の修正、同等の置換及び改善などは、すべて本開示の保護範囲に含まれるべきである。