IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌイーシー ラボラトリーズ アメリカ インクの特許一覧

特表2024-515622マルチホップ統合構文グラフを用いたインテント検出
<>
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図1
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図2
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図3
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図4
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図5
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図6
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図7
  • 特表-マルチホップ統合構文グラフを用いたインテント検出 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-10
(54)【発明の名称】マルチホップ統合構文グラフを用いたインテント検出
(51)【国際特許分類】
   G06F 40/30 20200101AFI20240403BHJP
   G06F 40/279 20200101ALI20240403BHJP
【FI】
G06F40/30
G06F40/279
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023562848
(86)(22)【出願日】2022-04-13
(85)【翻訳文提出日】2023-12-12
(86)【国際出願番号】 US2022024567
(87)【国際公開番号】W WO2022221379
(87)【国際公開日】2022-10-20
(31)【優先権主張番号】63/174,716
(32)【優先日】2021-04-14
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/718,856
(32)【優先日】2022-04-12
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.FACEBOOK
2.JAVA
(71)【出願人】
【識別番号】504080663
【氏名又は名称】エヌイーシー ラボラトリーズ アメリカ インク
【氏名又は名称原語表記】NEC Laboratories America, Inc.
(74)【代理人】
【識別番号】100123788
【弁理士】
【氏名又は名称】宮崎 昭夫
(74)【代理人】
【識別番号】100127454
【弁理士】
【氏名又は名称】緒方 雅昭
(72)【発明者】
【氏名】ジャン、 シュチャオ
(72)【発明者】
【氏名】リウ、 ヤンチ
(72)【発明者】
【氏名】チェン、 ハイフォン
(57)【要約】
マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための方法が提示される。本方法は、ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出し、多言語の事前訓練された言語モデルを用いることで、構文情報の単語をトークナイズし、単語それぞれのサブワードを生成し、生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトをトークナイズされたサブワードに一致させ、統合構文グラフを生成し、マルチホップ統合構文グラフエンコーダを用いて統合構文グラフをエンコードして出力を生成し、出力からインテントのアクション及びオブジェクトを予測することを含む。
【選択図】図8
【特許請求の範囲】
【請求項1】
マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための方法であって、
ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出し(1001)、
多言語の事前訓練された言語モデルを用いることで、前記構文情報の前記単語をトークナイズし、前記単語それぞれのサブワードを生成し(1003)、
前記生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトを前記トークナイズされたサブワードに一致させ(1005)、
統合構文グラフを生成し(1007)、
マルチホップ統合構文グラフエンコーダを用いて前記統合構文グラフをエンコードして出力を生成し(1009)、
前記出力からインテントのアクション及びオブジェクトを予測する(1011)、方法。
【請求項2】
前記構文情報は、少なくとも前記単語それぞれの品詞、従属関係、抽象的な意味関係をさらに含む、請求項1に記載の方法。
【請求項3】
前記統合構文グラフの生成は、トークンノードの構築、ノード関係の構築及びセンテンス間関係の構築を含む、請求項1に記載の方法。
【請求項4】
前記マルチホップ統合構文グラフエンコーダは、構文構造アテンションコンポーネント及びマルチヘッドセマンティックアテンションコンポーネントを含む、請求項1に記載の方法。
【請求項5】
前記構文構造アテンションコンポーネントは、前記統合構文グラフから入力としてエッジ関係及びノード属性を受信し、前記マルチヘッドセマンティックアテンションコンポーネントは入力としてシーケンシャル埋め込みを受信する、請求項4に記載の方法。
【請求項6】
第1のノードと第2のノードとが直接接続されている場合、エッジ埋め込みは従属関係のタイプとして初期化され、訓練プロセス中に微調整される、請求項5に記載の方法。
【請求項7】
第1のノードと第2のノードとが直接接続されていない場合、エッジ埋め込みは全てのエッジセグメントの合計である、請求項5に記載の方法。
【請求項8】
マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための、コンピュータで読み取り可能なプログラムを含む非一時的なコンピュータで読み取り可能な記録媒体であって、
前記コンピュータで読み取り可能なプログラムがコンピュータで実行されると、前記コンピュータに、
ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出し(1001)、
多言語の事前訓練された言語モデルを用いることで、前記構文情報の前記単語をトークナイズし、前記単語それぞれのサブワードを生成し(1003)、
前記生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトを前記トークナイズされたサブワードに一致させ(1005)、
統合構文グラフを生成し(1007)、
マルチホップ統合構文グラフエンコーダを用いて前記統合構文グラフをエンコードして出力を生成し(1009)、
前記出力からインテントのアクション及びオブジェクトを予測する(1011)ことを実行させる、非一時的なコンピュータで読み取り可能な記録媒体。
【請求項9】
前記構文情報は、少なくとも前記単語それぞれの品詞、従属関係、抽象的な意味関係をさらに含む、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
【請求項10】
前記統合構文グラフの生成は、トークンノードの構築、ノード関係の構築及びセンテンス間関係の構築を含む、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
【請求項11】
前記マルチホップ統合構文グラフエンコーダは、構文構造アテンションコンポーネント及びマルチヘッドセマンティックアテンションコンポーネントを含む、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
【請求項12】
前記構文構造アテンションコンポーネントは、前記統合構文グラフから入力としてエッジ関係及びノード属性を受信し、前記マルチヘッドセマンティックアテンションコンポーネントは入力としてシーケンシャル埋め込みを受信する、請求項11に記載の非一時的なコンピュータで読み取り可能な記録媒体。
【請求項13】
第1のノードと第2のノードとが直接接続されている場合、エッジ埋め込みは従属関係のタイプとして初期化され、訓練プロセス中に微調整される、請求項12に記載の非一時的なコンピュータで読み取り可能な記録媒体。
【請求項14】
第1のノードと第2のノードとが直接接続されていない場合、エッジ埋め込みは全てのエッジセグメントの合計である、請求項12に記載の非一時的なコンピュータで読み取り可能な記録媒体。
【請求項15】
マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するためのシステムであって、
メモリと、
ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出し(1001)、
多言語の事前訓練された言語モデルを用いることで、構文情報の前記単語をトークナイズし、前記単語それぞれのサブワードを生成し(1003)、
前記生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトを前記トークナイズされたサブワードに一致させ(1005)、
統合構文グラフを生成し(1007)、
マルチホップ統合構文グラフエンコーダを用いて前記統合構文グラフをエンコードして出力を生成し(1009)、
前記出力からインテントのアクション及びオブジェクトを予測する(1011)ように構成された、前記メモリと通信する1つまたは複数のプロセッサと、
を有するシステム。
【請求項16】
前記構文情報は、少なくとも前記単語それぞれの品詞、従属関係、抽象的な意味関係をさらに含む、請求項15に記載のシステム。
【請求項17】
前記統合構文グラフの生成は、トークンノードの構築、ノード関係の構築及びセンテンス間関係の構築を含む、請求項15に記載のシステム。
【請求項18】
前記マルチホップ統合構文グラフエンコーダは、構文構造アテンションコンポーネント及びマルチヘッドセマンティックアテンションコンポーネントを含む、請求項15に記載のシステム。
【請求項19】
前記構文構造アテンションコンポーネントは、前記統合構文グラフから入力としてエッジ関係及びノード属性を受信し、前記マルチヘッドセマンティックアテンションコンポーネントは入力としてシーケンシャル埋め込みを受信する、請求項18に記載のシステム。
【請求項20】
第1のノードと第2のノードとが直接接続されている場合、エッジ埋め込みは従属関係のタイプとして初期化され、訓練プロセス中に微調整され、前記第1のノードと前記第2のノードとが直接接続されていない場合、エッジ埋め込みは全てのエッジセグメントの合計である、請求項19に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2021年4月14日に出願された米国仮特許出願第63/174,716号及び2022年4月12日に出願された米国特許出願第17/718,856号を基礎とする優先権を主張し、それぞれの開示の全てをここに取り込む。
【0002】
本発明は、インテント検出に関し、より詳細にはマルチホップ統合構文グラフを用いたインテント検出に関する。
【背景技術】
【0003】
インテント検出は、チャットボット及び知的対話システムで使用されるテキスト分類タスクである。その目的は、ユーザのメッセージの背後にあるセマンティックを捕捉し、それを適切なラベルに割り当てることである。このようなシステムは、ほんの数例が与えられただけで、訓練されたテキストと同じカテゴリに属する新規のテキストを認識することを学習しなければならない。ユーザは、リクエストを曖昧に表現する傾向があるため、これは思考作業になることがよくある。インテント検出は、多くの自然言語理解(NLU:Natural Language Understanding)システムの重要な要素である。インテント検出が無ければ、信頼性の高いダイアロググラフを構築できないため、インテント検出はチャットボットにとって有益である。ユーザの意味を検出することは、知的対話システムの主要な機能である。これにより、システムは対話を正しい方向に導き、ユーザの質問に答え、ユーザが達成したいアクションを実行できるようになる。
【発明の概要】
【0004】
マルチホップ統合構文グラフ(IDMG:Multi-hop Unified Syntactic Graph)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための方法が提示される。本方法は、ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出し、多言語の事前訓練された言語モデルを用いることで、構文情報の単語をトークナイズし、単語それぞれのサブワードを生成し、生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトをトークナイズされたサブワードに一致させ、統合構文グラフを生成し(1007)、マルチホップ統合構文グラフエンコーダを用いて統合構文グラフをエンコードして出力を生成し、出力からインテントのアクション及びオブジェクトを予測することを含む。
【0005】
マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための、コンピュータで読み取り可能なプログラムを含む非一時的なコンピュータで読み取り可能な記録媒体が提示される。コンピュータで読み取り可能なプログラムがコンピュータで実行されると、コンピュータに、ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出し、多言語の事前訓練された言語モデルを用いることで、構文情報の単語をトークナイズし、単語それぞれのサブワードを生成し、生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトをトークナイズされたサブワードに一致させ、統合構文グラフを生成し、マルチホップ統合構文グラフエンコーダを用いて統合構文グラフをエンコードして出力を生成し、出力からインテントのアクション及びオブジェクトを予測することを実行させる。
【0006】
マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するためのシステムが提示される。本システムは、メモリと、ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出し、多言語の事前訓練された言語モデルを用いることで、構文情報の単語をトークナイズし、単語それぞれのサブワードを生成し、生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトをトークナイズされたサブワードに一致させ、統合構文グラフを生成し、マルチホップ統合構文グラフエンコーダを用いて統合構文グラフをエンコードして出力を生成し、出力からインテントのアクション及びオブジェクトを予測するように構成された、メモリと通信する1つまたは複数のプロセッサとを有する。
【0007】
これら及び他の特徴並びに利点は、以下の典型的な実施形態の詳細な説明を添付の図面と併せて読むことで明らかになるであろう。
【0008】
本開示では、後述するように、以下の図面を参照しながら好ましい実施形態について詳細に説明する。
【図面の簡単な説明】
【0009】
図1図1は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出の例示的な手順のブロック/フロー図である。
【0010】
図2図2は、本発明の一実施形態による、IDMGの例示的なアーキテクチャグラフのブロック/フロー図である。
【0011】
図3図3は、本発明の一実施形態による、例示的なマルチホップ統合構文グラフエンコーダのブロック/フロー図である。
【0012】
図4図4は、本発明の一実施形態による、マルチホップ埋め込みのための1つの中間ノードによって接続される2つのノードを示すブロック/フロー図である。
【0013】
図5図5は、本発明の一実施形態による、統合構文グラフ生成の手順を示すブロック/フロー図である。
【0014】
図6図6は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための例示的な実際の応用例である。
【0015】
図7図7は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための例示的な処理システムである。
【0016】
図8図8は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出する例示的な方法のブロック/フロー図である。
【発明を実施するための形態】
【0017】
インテント認識は、インテント分類とも呼ばれ、書面または口頭による入力を受け取り、それをユーザが達成したいことに基づいて分類するタスクである。インテント認識は、チャットボットの重要な要素を形成し、売上高変換、顧客サポート、その他多くの分野で使用されている。インテント認識は、人工知能のサブフィールドである自然言語処理(NLP)の一種である。NLPは、自然言語、つまりコンピュータコーディング言語のように人工的ではなく、自然に発達した言語をコンピュータで処理及び分析することに関連する。
【0018】
本発明の例示的な実施形態は、各テキストサンプルがビジネスニーズの記述であるか、またはそれを表すビジネスニーズコーパスを提示する。
【0019】
目的は、インテントのアクション及びオブジェクトを用いてビジネスニーズのインテントを検出することである。
【0020】
本発明の例示的な実施形態は、ビジネスニーズのインテント検出問題に対処するために、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出方法を提案する。本発明の例示的な実施形態には以下が含まれる。
【0021】
構文解析では、ビジネスニーズの記述が解析され、例えば、品詞、従属関係及び抽象的な意味関係を含む構文情報が抽出される。
【0022】
事前訓練モデルのトークナイズでは、従属関係の解析から抽出された単語がトークナイズされ、各単語のサブワードが多言語の事前訓練された言語モデルによって生成される。
【0023】
トークンサブワードアラインメントでは、生成されたサブワードがサブワードに対するグラウンドトゥルース回答スパンと一致するようにアライメントが実施される。
【0024】
ビジネスニーズグラフの生成では、生成されたトークン及び従属関係に基づいて、各文章のビジネスニーズのグラフが生成される。
【0025】
グラフエンコードでは、生成されたビジネスニーズのグラフがニーズの記述のためにエンコードされる。
【0026】
インテント予測では、グラフエンコードの出力が、インテントのアクション及びオブジェクトを予測するために使用される。
【0027】
ビジネスインテントの検出モデルの本発明の特徴には、少なくとも以下が含まれる。
【0028】
新規なビジネスニーズは、ビジネスインテントを抽出するために構文情報が利用できるように、インテント検出のためのグラフ表現を必要とする。
【0029】
新規なマルチホップグラフエンコード方法が、複数のホップにわたって累積された統合構文グラフにおける単語間のセマンティックな関係及び構文関係をモデル化するために提案される。
【0030】
図1は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出の例示的な手順のブロック/フロー図である。
【0031】
IDMGプロセス5は、ビジネスニーズコーパス10、構文解析を可能にする構文解析器(parser)12、トークンアライメントを可能にするトークンアライナ(tokenaligner)14、ビジネスニーズグラフ生成器16及びグラフエンコーダ18を含む。事前訓練された言語モデル(LM)トークナイザ20及び事前訓練された言語モデル(LM)エンコーダ22がさらに使用される。出力24は、インテントのアクション及びオブジェクトの予測である。IDMGプロセス5については、以下でさらに詳細に説明する。
【0032】
図2は、本発明の一実施形態による、IDMG25の例示的なアーキテクチャグラフのブロック/フロー図である。
【0033】
テキストコーパスデータ30は、シーケンシャルエンコーダ32に供給され、構文解析31及びトークンアライメント34を可能にする。次に、データは統合構文グラフ36に供給され、その後、統合構文エンコーダ38に提供される。さらなる処理40は、インテント出力42を取得するために行われる。インテント出力42は、インテントオブジェクト(B-OBJ、I-OBJ)及びアクション(B-ACT)を含む。IDMGアーキテクチャ25については、以下でさらに詳細に説明する。
【0034】
ビジネスニーズコーパスデータに関して、テキストコーパスデータはビジネスニーズのセットを含む。通常、ビジネスニーズ毎に、対応する記述が複数の文章で提供される。
【0035】
構文解析に関して、構文情報がビジネスニーズデータから解析される。具体的には、次の情報を抽出できる。
【0036】
コンテキストと質問の両方に対するトークンと単語のリスト。
【0037】
各単語の品詞(POS:Part-of Speech)。
【0038】
文中の単語間の関係。
【0039】
事前訓練モデルのトークナイズに関して、抽出された単語がトークナイズされ、英語に関するBERT等の事前訓練された言語モデルによって各単語のサブワードが生成される。ビジネスニーズがフランス語や日本語等の他の言語で記述されている場合、mBERTやXLMR等の事前訓練済みの多言語言語モデルが使用される。特に、事前訓練されたモデルのトークナイザは、サブワードを生成するために使用される。
【0040】
トランスフォーマからの双方向エンコーダ表現(BERT:BidirectionalEncoder Representations from Transformers)は、Google社によって開発された自然言語処理(NLP)の事前訓練のためのトランスフォーマベースの機械学習技術である。BERTは2018年に作成され、公開された。2019年、Google社は、検索エンジンでBERTの活用を開始したと発表し、2020年後半までにほぼ全ての英語のクエリでBERTを使用するようになった。
【0041】
mBERTは、多言語BERT(multilingual BERT)を表し、コンテキストにおける単語の意味を理解するモデルを作成する際の次のステップである。MBERTは、104の言語で同時に訓練された深層学習モデルであり、104の言語の知識をまとめてエンコードする。
【0042】
XLMRは、XLM ロバータ(XLM-Roberta)を表す。FacebookのAIチームは、オリジナルのXLM-100モデルのアップデートとして、2019年11月にXLM-RoBERTaをリリースした。どちらもトランスフォーマに基づく言語モデルであり、マスクされた言語モデルの目的に依存しており、どちらも100種類の異なる言語のテキストを処理できる。XLM-Robertaがオリジナルと比較して提供する最大のアップデートは、訓練データの量が大幅に増加したことである。「RoBERTa」パートは、その訓練ルーチンが単一言語のRoBERTaモデルと同じであるという事実、特に唯一の訓練目的がマスクされた言語モデル(Masked Language Model)であるという事実に由来している。
【0043】
トークンアラインメントに関して、生成されたサブワードは、構文解析器によって生成されたトークンにアライメントが実施される。トークンとサブワードのアライメントの目的は、事前訓練された言語モデルによって、グラウンドトゥルースのインテントのアクション及びオブジェクトをトークナイズされたサブワードと一致させることである。
【0044】
事前訓練モデルのエンコードに関して、文章における単語は事前訓練言語モデルを用いてエンコードされ、グラフエンコードステップのために低次元表現が抽出される。
【0045】
統合構文グラフの生成に関して、生成されたトークン及び従属関係に基づいて、統合構文グラフは以下のステップで生成される。
【0046】
ノード構築。
【0047】
ノード関係の構築。
【0048】
センテンス間関係の構築。
【0049】
マルチホップ統合構文グラフエンコードに関して、生成された統合構文グラフは、インテント検出のためにエンコードされる。マルチホップ統合構文グラフエンコーダの全体的なアーキテクチャを図3に示す。
【0050】
図3は、本発明の一実施形態による、例示的なマルチホップ統合構文グラフエンコーダ50のブロック/フロー図である。
【0051】
構文グラフ52は、adj行列データ、エッジ関係データ及びノード属性(POS)データを構文構造アテンションコンポーネント56に供給する。シーケンシャル埋め込み54は、マルチヘッドセマンティックアテンションコンポーネント58に供給される。構文構造アテンションコンポーネント56(例えば、構文情報埋め込み62)とマルチヘッドセマンティックアテンションコンポーネント58からのデータは連結されて内積60を形成する。出力64は、出力68を生成するために全結合層66に供給される。
【0052】
まず、ノードiとノードjとの間の関係は次のように表される。
【数1】
【0053】
ここで、pi及びpjは、i番目及びj番目のトークンのノード属性埋め込みであり、rijはエッジ関係の埋め込みである。pi及びpjのノード埋め込みは、事前訓練された言語モデルの埋め込みとその品詞の埋め込みを連結したものである。
【0054】
ノードiとノードjとが直接接続されている場合、エッジ埋め込みrijは従属関係のタイプとして初期化され、訓練プロセス中に微調整される。ノードiとノードjとが直接接続されていない場合、エッジ埋め込みrijは全てのエッジセグメントの合計になる。
【0055】
図4は、1つの中間ノードによって接続された2つのノードの例80を示す。
【0056】
マルチホップ埋め込み82は、次のように表すことができる。
【数2】
【0057】
ここで、kはマルチホップ数、jは次元のインデックス、dは時間エンコードの次元サイズである。
【0058】
次に、そのマルチホップパス関係84に基づくノードiの表現は、次のように定義できる。
【数3】
【0059】
ここで、
【数4】
は、マルチホップ強化グラフ
【数5】
におけるノードiの隣接ノードを表す。
【数6】
は、t番目の層のノード表現である。
【0060】
その後、zt及びノード埋め込みniは、インテント検出層の入力として連結される。
【0061】
インテント検出予測に関して、全結合層への出力は、次の3つのカテゴリ、すなわち、None、ACT及びOBJにおけるインテントのシーケンシャルラベルを予測するために個別に使用される。ここで、「ACT」はインテントのアクションを表し、「OBJ」はインテントのオブジェクトを表す。トークンがインテントのアクションにもオブジェクトにも属さない場合、それらはラベル「None」として分類される。
【0062】
図5は、本発明の一実施形態による、統合構文グラフ生成100の手順を示すブロック/フロー図である。
【0063】
トークンノード構築102に関して、例示的な方法は、生成されたサブワードを用いることで統合構文グラフ内にノードを構築する。具体的には、初期のノードの埋め込みは、事前訓練された言語モデルとPOSのタグ付けとによって連結される。
【0064】
従属関係構築104に関して、例示的な方法は、以下の2つの関係を用いてノードを接続する。
【0065】
従属関係を有するノード(サブワード)。エッジのタイプは、従属構文解析器によって生成された関係として使用される。
【0066】
サブワードは、従属構文解析器によって生成された同じ単語に属する。例示的な方法は、これら全てのタイプのサブワードを接続するためのサブワード関係等の新しいタイプの関係を作成する。
【0067】
センテンス間関係構築106に関して、例示的な方法は、各センテンスのルートノードを一緒に接続し、「センテンス間」関係と呼ばれる新規のタイプの関係を割り当てる。
【0068】
結論として、IDMG25は、ユーザのクエリに対するより速く、より正確な応答を可能にする。したがって、IDMGにより計算と処理が削減され、チャットボットがユーザのクエリに対してより正確な応答を提供できるため、チャットボット通信または対話型ロボット通信を大幅に改善できる。
【0069】
図6は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出する実際のアプリケーションのブロック/フロー図800である。
【0070】
実際的な一例において、チャットボット802が「どのようなご用件ですか?」と質問する。第1の人物810はクエリ812を有する。クエリ812は「お金を引き出したいのですが」である。第2の人物820はクエリ822を有する。クエリ822は「今、現金が必要です」である。第3の人物830はクエリ832を有する。クエリ832は「Xuchaoに送金して下さい」である。クエリ812、822、832は、インテント検出モデル(IDMG 25)に入力される。IDMG25は、上述の構文解析12、トークンアライメント14、ビジネスニーズ生成グラフ16及びグラフエンコード18を適用することで、クエリまたはリクエストを処理する。IDMG25は、予測結果である出力840、850を生成する。出力840は、ユーザ810、820、830のクエリ812、822、832に基づいてお金の引き出しを開始し、出力850は送金を開始する。
【0071】
したがって、例示的な実施形態は、多くの異なるタイプの実際の用途に適用できる。インテント分類はインテント認識とも呼ばれ、理解し易くするためにテキストを様々なグループに分類することに焦点を当てたNLPの一分野である。本質的に、インテント分類は、事前に定義されたインテンションのセットから自然言語音声を正しく検出する行為である。
【0072】
顧客サービスは多くの企業によって高く評価されている。組織の代表者とクライアントとの間の対話は、より良いサービスを提供するために自動化できる(図6の実際の応用例のように)。顧客の大多数は、会社に連絡するときに特定のリクエストや質問を念頭に置いている。顧客にサービスを提供するには、顧客の目的を分類する必要がある。
【0073】
インテント認識または分類の目的は、顧客がなぜ会社に連絡したのか、並びに顧客が何を達成しようとしているのかを判断することである。インテントの分類を利用して対話を自動化する対話システムは、部分的または全体的に対話を自動化できる。
【0074】
人の表現は、例えば、受信メッセージを必要な専門知識を有する担当者に送信することで、インテントの分類から恩恵を受けることがある。
【0075】
NLPは、対話を開始するユーザのインテントまたは動機を理解するためにチャットボット802で使用される。機械学習分類アルゴリズムは、それを分類し、訓練データに応じて適切に応答する。これは、チャットボット802がユーザによる販売、マーケティングまたは顧客サービスの目的を達成するために効果的であるか否かを判定する重要な機能である。例示的な実施形態のIDMG25は、顧客サービスの目的の達成を支援できる。
【0076】
図7は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出するための例示的な処理システムである。
【0077】
処理システムは、システムバス902を介して他のコンポーネントに動作可能に接続された少なくとも1つのプロセッサ(CPU)904を含む。システムバス902には、GPU905、キャッシュ906、読み取り専用メモリ(ROM)908、ランダムアクセスメモリ(RAM)910、入出力(I/O)アダプタ920、ネットワークアダプタ930、ユーザインタフェースアダプタ940及び/またはディスプレイアダプタ950もまた動作可能に接続されている。さらに、IDMG25は、上述の構文解析12、トークンアライメント14、ビジネスニーズ生成グラフ16及びグラフエンコード18を適用することによってクエリまたはリクエストを処理する。
【0078】
記憶装置922は、I/Oアダプタ920によってシステムバス902に動作可能に接続されている。記憶装置922は、ディスク記憶装置(例えば、磁気ディスク記憶装置または光ディスク記憶装置)、固体磁気装置等のいずれであってもよい。
【0079】
トランシーバ932は、ネットワークアダプタ930によってシステムバス902に動作可能に接続されている。
【0080】
ユーザ入力装置942は、ユーザインタフェースアダプタ940によってシステムバス902に動作可能に接続されている。ユーザ入力装置942は、キーボード、マウス、キーパッド、画像キャプチャ装置、モーション感知装置、マイクロフォン、あるいはこれらの装置のうちの少なくとも2つの装置の機能を組み込んだ装置等のいずれであってもよい。もちろん、本発明の原理の主旨を維持しながら、他のタイプの入力装置を使用することもできる。もちろん、本発明の精神を維持しながら、他のタイプの入力装置も使用することができる。ユーザ入力装置942は、同じタイプのユーザ入力装置であってもよく、異なるタイプのユーザ入力装置であってもよい。ユーザ入力装置942は、処理システムに情報を入力し、処理システムから情報を出力するために使用される。
【0081】
ディスプレイ装置952は、ディスプレイアダプタ950によってシステムバス902に動作可能に接続されている。
【0082】
もちろん、処理システムは、当業者であれば容易に思いつくような他の要素(図示せず)を含んでもよく、特定の要素を省略することも可能である。例えば、当業者であれば容易に理解できるが、処理システムには、その詳細な実施に応じて他の様々なタイプの入力装置及び/または出力装置を含むことができる。例えば、無線及び/または有線による様々な入力装置及び/または出力装置を使用できる。さらに、当業者であれば容易に理解できるが、様々な構成の追加プロセッサ、コントローラ、メモリ等を使用することも可能である。処理システムの上記及び他の変形例は、本明細書で提供される本原理の教示によって当業者であれば容易に考えられるであろう。
【0083】
図8は、本発明の一実施形態による、マルチホップ統合構文グラフ(IDMG)を用いたインテント検出を使用することで、ビジネスインテントコーパスからビジネスインテントを検出する例示的な方法のブロック/フロー図である。
【0084】
ブロック1001において、ビジネスニーズの記述を表す各テキストサンプルを解析し、少なくともトークン及び単語を含む構文情報を抽出する。
【0085】
ブロック1003において、多言語の事前訓練された言語モデルを用いることで構文情報の単語をトークナイズし、単語それぞれのサブワードを生成する。
【0086】
ブロック1005において、生成されたサブワードを構文情報のトークンにアライメントを実施し、グラウンドトゥルースのインテントのアクション及びオブジェクトをトークナイズされたサブワードに一致させる。
【0087】
ブロック1007において、統合構文グラフを生成する。
【0088】
ブロック1009において、マルチホップ統合構文グラフエンコーダを用いて統合構文グラフをエンコードして出力を生成する。
【0089】
ブロック1011において、出力からインテントのアクション及びオブジェクトを予測する。
【0090】
本明細書で用いる「データ」、「コンテンツ」、「情報」及び同様の用語は、様々な例示的な実施形態によって取得され、送信され、受信され、表示され、及び/または保存可能なデータを示すために、交換可能に使用できる。したがって、これらの用語の使用は、開示の主旨及び範囲を制限するものと解釈されるべきではない。さらに、本明細書に別の計算デバイスからデータを受信するための計算デバイスが記載されている場合、データは、別の計算デバイスから直接受信してもよく、1つまたは複数の中間計算デバイス、例えば1つまたは複数のサーバ、リレー、ルータ、ネットワークアクセスポイント、基地局等を介して間接的に受信してもよい。同様に、本明細書にデータを別の計算デバイスに送信するための計算デバイスが記載されている場合、データは、別の計算データに直接送信してもよく、例えば、1つまたは複数のサーバ、リレー、ルータ、ネットワークアクセスポイント、基地局及び/または同様のもの等の1つまたは複数の中間計算デバイスを介して間接的に送信してもよい。
【0091】
当業者であれば理解するように、本発明の態様は、システム、方法またはコンピュータプログラムプロダクトとして実現してもよい。したがって、本発明の態様は、全体としてハードウェアの実施形態であってもよく、全体としてソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコード等を含む)であってもよく、本明細書において、一般に「回路」、「モジュール」、「計算機」、「装置」または「システム」と呼ぶことができる、ソフトウェアとハードウェアの態様を組み合わせた実施の形態を採用してもよい。さらに、本発明の態様は、コンピュータで読み取り可能なプログラムコードを有する、1つまたは複数のコンピュータで読み取り可能な媒体で具現化された、コンピュータプログラムプロダクトの形態を採用してもよい。
【0092】
1つまたは複数のコンピュータで読み取り可能な媒体の任意の組合せを用いてもよい。コンピュータで読み取り可能な媒体は、コンピュータで読み取り可能な信号媒体またはコンピュータで読み取り可能な記録媒体であってもよい。コンピュータで読み取り可能な記録媒体は、例えば、電子、磁気、光学、電磁気、赤外線または半導体システム、装置またはデバイス、あるいは前述の任意の適切な組合せとすることができるが、これらに限定されない。コンピュータで読み取り可能な記録媒体のより具体的な例(以下に限定されない)は、1つまたは複数のワイヤ、携帯用コンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROMまたはフラッシュメモリ)、光ファイバ、携帯用コンパクトディスクリードオンリーメモリ(CD-ROM)、光データ記憶装置、磁気データ記憶装置または前述した任意の適切な組み合わせを含む。本文書のコンテキストにおいて、コンピュータで読み取り可能な記録媒体は、命令実行システム、装置またはデバイスによって、またはそれに関連して使用するためのプログラムを含む、またはそれを記憶できる、任意の有形媒体であってもよい。
【0093】
コンピュータで読み取り可能な信号媒体には、例えば、ベースバンドで、または搬送波の一部として、コンピュータで読み取り可能なプログラムコードが具現化された伝搬データ信号を含むことができる。そのような伝播信号は、電磁、光学またはそれらの任意の適切な組み合わせを含むが、それらに限定されない、任意の様々な形態がある。コンピュータ読み取り可能な信号媒体は、コンピュータ読み取り可能な記録媒体ではなく、命令実行システム、装置または装置によって、またはそれに関連して使用するためにプログラムを通信、伝播、または移送できる、任意のコンピュータ読み取り可能な媒体であってもよい。
【0094】
コンピュータで読み取り可能な媒体で具現化されるプログラムコードは、無線、有線、光ファイバケーブル、RF等、あるいは前述した任意の適切な組合せを含むが、これらに限定されない、任意の適切な媒体を用いて送信される。
【0095】
本発明の態様に関する処理を実行するためのコンピュータプログラムコードは、Java、Smalltalk(登録商標)、C++等のオブジェクト指向プログラミング言語及び「C」プログラミング言語または類似のプログラミング言語等の従来の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組み合わせで書くことができる。プログラムコードは、全体的にユーザのコンピュータで実行されてもよく、スタンドアロンソフトウェアパッケージとして部分的にユーザのコンピュータで実行されてもよく、部分的にユーザのコンピュータで実行され、かつ部分的にリモートコンピュータで実行されてもよく、全体的にリモートコンピュータまたはサーバで実行されてもよい。後者のシナリオにおいて、リモートコンピュータは、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータと接続されてもよく、(例えば、インターネットサービスプロバイダを利用したインターネットを介して)外部コンピュータと接続されてもよい。
【0096】
本発明の態様について、本発明の実施形態による方法、装置(システム)、並びにコンピュータプログラムプロダクトのフローチャート及び/またはブロック図を参照して以下で説明する。フローチャート及び/またはブロック図の各ブロック、並びにフローチャート及び/またはブロック図のブロックにおける組合せは、コンピュータプログラム命令によって実施できることを理解されたい。これらのコンピュータプログラム命令は、コンピュータまたは他のプログラマブルデータ処理装置のプロセッサを通して実行される命令が、フローチャート及び/またはブロック図の1つまたは複数のブロックまたはモジュールに指定される機能/動作を実施するための手段を作り出すようなマシンを生成するために、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサに提供される。
【0097】
これらのコンピュータプログラム命令は、コンピュータで読み取り可能な媒体に保存された命令が、フローチャート及び/またはブロック図の1つまたは複数のブロックまたはモジュールに指定された機能/動作を実施するための命令を含むプロダクトを生成するように、コンピュータ、他のプログラマブルデータ処理装置または他のデバイスに、特定の方法で機能するように指示できるコンピュータで読み取り可能な媒体に保存できる。
【0098】
コンピュータプログラム命令は、またコンピュータ、他のプログラマブルデータ処理装置または他のデバイスにロードされて、一連の動作ステップがコンピュータ、他のプログラマブル装置または他のデバイスで実行され、コンピュータまたは他のプログラマブル装置で実行される命令が、フローチャート及び/またはブロック図のブロックまたはモジュールに指定された機能/動作を実施するためのプロセスを提供するように、コンピュータで実施されるプロセスを生成できる。
【0099】
本明細書で使用する「プロセッサ」という用語は、例えばCPU(central processing unit)及び/または他の処理回路を含むもの等、任意の処理装置を含むことを意図している。また、「プロセッサ」という用語は1つまたは複数の処理装置を指すことが可能であり、処理装置に関連する様々な要素は、他の処理装置によって共有されることも理解されたい。
【0100】
本明細書で使用する「メモリ」という用語は、例えば、RAM、ROM、固定メモリデバイス(例えば、ハードドライブ)、リムーバブルメモリデバイス(例えば、ディスケット)、フラッシュメモリ等、プロセッサまたはCPUに関連するメモリを含むことを意図している。このようなメモリは、コンピュータで読み取り可能な記録媒体と考えることができる。
【0101】
さらに、本明細書で使用する「入力/出力装置」または「I/O装置」という用語は、例えば、処理ユニットにデータを入力するための1つまたは複数の入力装置(例えば、キーボード、マウス、スキャナ等)及び/または処理ユニットに関連する、結果を提示するための1つまたは複数の出力装置(例えば、スピーカ、ディスプレイ、プリンタ等)を含むことを意図する。
【0102】
上記は、あらゆる観点において説明的かつ典型的であって限定的でないものと理解されるべきであり、本明細書で開示する本発明の範囲は、詳細な説明から決定されるべきではなく、特許法で認められた最大限の広さに基づいて解釈される特許請求の範囲から決定されるべきである。本明細書中に図示及び記載されている実施形態は、本発明の原理を説明するものにすぎず、本発明の範囲及び主旨から逸脱することなく当業者は様々な変更を実施することができることを理解されたい。当業者は、本発明の範囲及び精神から逸脱することなく、様々な他の特徴の組み合わせを実施できる。以上、本発明の態様について、特許法で要求される細部及び詳細な事項と共に説明したが、特許証で保護されることを要求する特許請求の範囲は、添付の特許請求の範囲に示されている。
図1
図2
図3
図4
図5
図6
図7
図8
【国際調査報告】