特許7420842 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ サービスナウ，　インコーポレイテッドの特許一覧

特許7420842自然言語理解（ＮＬＵ）フレームワークにおける予測的類似性スコアリングサブシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-01-15

(45)【発行日】2024-01-23

(54)【発明の名称】自然言語理解（ＮＬＵ）フレームワークにおける予測的類似性スコアリングサブシステム

(51)【国際特許分類】

G06F 16/90 20190101AFI20240116BHJP

G06F 40/56 20200101ALI20240116BHJP

【ＦＩ】

G06F16/90 100

G06F40/56

【請求項の数】 13

(21)【出願番号】P 2021577215

(86)(22)【出願日】2020-07-01

(65)【公表番号】

(43)【公表日】2022-09-05

(86)【国際出願番号】 US2020040569

(87)【国際公開番号】W WO2021003311

(87)【国際公開日】2021-01-07

【審査請求日】2022-02-24

(31)【優先権主張番号】62/869,817

(32)【優先日】2019-07-02

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/869,864

(32)【優先日】2019-07-02

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/869,826

(32)【優先日】2019-07-02

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/869,811

(32)【優先日】2019-07-02

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】16/570,506

(32)【優先日】2019-09-13

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】518249328

【氏名又は名称】サービスナウ，インコーポレイテッド

【氏名又は名称原語表記】ＳｅｒｖｉｃｅＮｏｗ，Ｉｎｃ．

(74)【代理人】

【識別番号】100121083

【弁理士】

【氏名又は名称】青木宏義

(74)【代理人】

【識別番号】100138391

【弁理士】

【氏名又は名称】天田昌行

(74)【代理人】

【識別番号】100074099

【弁理士】

【氏名又は名称】大菅義之

(72)【発明者】

【氏名】サプガイエドウィン

(72)【発明者】

【氏名】パクジョングン

(72)【発明者】

【氏名】ヒートン－ダンラップアンキャサリン

【審査官】成瀬博之

(56)【参考文献】

【文献】国際公開第２００７／１０５６１５（ＷＯ，Ａ１）

【文献】特表２０１７－５３６６０１（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１７／００６９３１０（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１８／０３２９８７９（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｆ４０／２０－４０／５８

(57)【特許請求の範囲】

【請求項1】

形式クラスデータベースを有する類似性スコアリングサブシステムを含む自然言語理解（ＮＬＵ）フレームワークを実行するための命令を記憶するメモリと、
前記命令を実行するように構成されたプロセッサと、
を含むエージェント自動化システムであって、
前記命令が、前記プロセッサに、
ユーザ発話の意味表現を受け取るステップと、
前記意味表現の認知構文文法（ＣＣＧ）形式を識別するステップと、
前記意味表現の前記ＣＣＧ形式に整合する前記形式クラスデータベースの少なくとも１つの形式クラスエントリを判定するステップと、
前記少なくとも１つの形式クラスエントリからの数学的比較関数リストを検索するステップと、
を含む動作を実行させ、
前記数学的比較関数リストは、前記類似性スコアリングサブシステムが、前記意味表現の少なくとも一部分と探索空間意味表現の少なくとも探索空間部分との間の類似性スコアを判定するために、前記意味表現の前記少なくとも一部分と前記探索空間意味表現の前記少なくとも探索空間部分とを比較することを有効にする、エージェント自動化システム。

【請求項2】

前記数学的比較関数リストは、前記類似性スコアリングサブシステムが、前記意味表現と前記探索空間意味表現とを比較するために、より計算的に高価な関数を累進的に利用することを有効にする順序付きの関数セットを含む、請求項１に記載のエージェント自動化システム。

【請求項3】

前記探索空間意味表現が、前記ＮＬＵフレームワークの探索空間を定義する複数の探索空間意味表現のうちの１つであり、
前記命令が、前記プロセッサに、前記ユーザ発話の前記意味表現に整合する前記複数の探索空間意味表現の部分集合に対して前記探索空間を探索するステップを含む動作を実行させる、請求項１に記載のエージェント自動化システム。

【請求項4】

前記命令が、前記プロセッサに、前記意味表現と前記探索空間意味表現との間の前記類似性スコアを判定するために、前記数学的比較関数リストを介して前記意味表現と前記探索空間意味表現とを比較するステップを含む動作を実行させる、請求項１に記載のエージェント自動化システム。

【請求項5】

前記プロセッサが、
前記類似性スコアを判定するために、前記意味表現の第１の根ノードと前記探索空間意味表現の第２の根ノードとを比較することと、
前記類似性スコアを精練するために、前記意味表現の前記第１の根ノードおよび第１の従属ノードと前記探索空間意味表現の前記第２の根ノードおよび第２の従属ノードとを比較することと、
によって、前記意味表現と前記探索空間意味表現とを比較するように構成される、請求項４に記載のエージェント自動化システム。

【請求項6】

前記命令が、前記プロセッサに、
前記類似性スコアが所定の閾値スコアより小さいかどうかを判定するステップと、
前記類似性スコアが前記所定の閾値スコアより小さいと判定したことに応答して、前記探索空間意味表現を前記意味表現との後の比較から無視するステップと、
を含む動作を実行させる、請求項５に記載のエージェント自動化システム。

【請求項7】

前記意味表現が発話木構造を含み、前記発話木構造が、根ノードと、前記根ノードに意味論的に結合された少なくとも１つの従属ノードとを含む、請求項１に記載のエージェント自動化システム。

【請求項8】

前記意味表現の前記少なくとも一部分が、前記根ノードであり、前記探索空間意味表現の前記少なくとも探索空間部分が、前記探索空間意味表現の探索空間根ノードであり、したがって前記類似性スコアが、前記根ノードの部分木ベクトルと前記探索空間根ノードの部分木ベクトルとの間の類似性を定量化する、請求項７に記載のエージェント自動化システム。

【請求項9】

前記ＣＣＧ形式が第１のＣＣＧ形式を含み、前記少なくとも１つの形式クラスエントリが第１の形式クラスエントリを含み、前記数学的比較関数リストが第１の数学的比較関数リストを含み、
前記命令が、前記プロセッサに、
前記意味表現の第２のＣＣＧ形式を識別するステップと、
前記意味表現の前記第２のＣＣＧ形式に整合する前記形式クラスデータベースの第２の形式クラスエントリを判定するステップと、
前記第２の形式クラスエントリから第２の数学的比較関数リストを検索するステップと、
を含む動作を実行させる、請求項１に記載のエージェント自動化システム。

【請求項10】

前記命令が、前記プロセッサに、
第１の類似性スコアを判定するために、前記第１の数学的比較関数リストを介して前記意味表現と前記探索空間意味表現とを比較するステップと、
第２の類似性スコアを判定するために、前記第２の数学的比較関数リストを介して前記意味表現と前記探索空間意味表現とを比較するステップと、
照合関数を介して前記第１の類似性スコアおよび前記第２の類似性スコアを総類似性スコアに集約するステップと、
を含む動作を実行させ、
前記総類似性スコアは、前記類似性スコアリングサブシステムが、前記探索空間意味表現が前記意味表現に対する整合であるかどうかを判定することを有効にする、請求項９に記載のエージェント自動化システム。

【請求項11】

命令を記憶する非一時的コンピュータ可読媒体であって、
前記命令は、エージェント自動化システムの１つまたは複数のプロセッサによって実行されるとき、前記エージェント自動化システムに類似性スコアリングサブシステムを実施させて、
受け取ったユーザ発話に対応する意味表現の認知構文文法（ＣＣＧ）形式を識別するステップと、
前記意味表現の前記ＣＣＧ形式に整合する形式クラスデータベースの少なくとも１つの形式クラスエントリを判定するステップと、
前記意味表現の前記ＣＣＧ形式に対応する、前記少なくとも１つの形式クラスエントリからの数学的比較関数リストを検索するステップであって、前記数学的比較関数リストは、前記類似性スコアリングサブシステムが、前記意味表現と探索空間意味表現とを累進的に比較することを有効にする、ステップと、
前記意味表現と前記探索空間意味表現とを比較するステップと、
を行うようにし、
前記意味表現と前記探索空間意味表現とを比較するステップが、
前記意味表現の第１の考慮部分と前記探索空間意味表現の第２の考慮部分との間の類似性を定量化する類似性スコアを判定するために、前記数学的比較関数リストのそれぞれの関数を適用するステップと、
前記類似性スコアが前記意味表現の全体と前記探索空間意味表現の少なくとも一部分との間の前記類似性を表すまで、または前記数学的比較関数リストの後の関数が前記数学的比較関数リストの最も高コストの関数になるまで、前記類似性スコアを精練するために、前記数学的比較関数リストの前記後の関数を適用するステップと、
を反復して行うことによって行われる、非一時的コンピュータ可読媒体。

【請求項12】

前記探索空間意味表現が、前記エージェント自動化システムの探索空間を定義する複数の探索空間意味表現のうちの１つである、請求項１１に記載の非一時的コンピュータ可読媒体。

【請求項13】

前記命令が、前記エージェント自動化システムに前記類似性スコアリングサブシステムを実施させて、
前記類似性スコアの各精練後、前記複数の探索空間意味表現のうち、所定のスコア閾値を上回るそれぞれの類似性スコアを提供する類似の探索空間意味表現に、前記探索空間を狭めるステップと、
前記それぞれの類似性スコアが、前記意味表現の全体との類似性を表した後、前記複数の探索空間意味表現のうち、前記探索空間内に残っている類似の探索空間意味表現を、前記意味表現との整合として識別するステップと、
を行うように構成される、請求項１２に記載の非一時的コンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

クロスリファレンス
本出願は、あらゆる目的で全体として参照により本明細書に組み込まれている、２０１９年７月２日に出願された「ＰＲＥＤＩＣＴＩＶＥＳＩＭＩＬＡＲＩＴＹＳＣＯＲＩＮＧＳＵＢＳＹＳＴＥＭＩＮＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８１７号の優先権および利益を主張する。本出願はまた、あらゆる目的で全体として参照により本明細書に組み込まれている、各々２０１９年７月２日に出願された「ＳＹＳＴＥＭＡＮＤＭＥＴＨＯＤＦＯＲＰＥＲＦＯＲＭＩＮＧＡＭＥＡＮＩＮＧＳＥＡＲＣＨＵＳＩＮＧＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８６４号、「ＤＥＲＩＶＩＮＧＭＵＬＴＩＰＬＥＭＥＡＮＩＮＧＲＥＰＲＥＳＥＮＴＡＴＩＯＮＳＦＯＲＡＮＵＴＴＥＲＡＮＣＥＩＮＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８２６号、および「ＰＩＮＮＩＮＧＡＲＴＩＦＡＣＴＳＦＯＲＥＸＰＡＮＳＩＯＮＯＦＳＥＡＲＣＨＫＥＹＳＡＮＤＳＥＡＲＣＨＳＰＡＣＥＳＩＮＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８１１号に関係する。

【0002】

本開示は、一般に、自然言語理解（ＮＬＵ）および人工知能（ＡＩ）の分野に関し、より詳細には、ＮＬＵのための予測的類似性スコアリングサブシステムに関する。

【背景技術】

【0003】

本章は、以下の説明および／または特許請求の範囲に記載する本開示の様々な態様に関係しうる様々な技術態様について、読者に紹介することを意図したものである。この議論は、本開示の様々な態様のさらなる理解を容易にするための背景情報を読者に提供することに役立つと考えられる。したがって、これらの記載はこれに鑑みて読まれるべきであり、従来技術の承認ではないことを理解されたい。

【0004】

クラウドコンピューティングは、一般にインターネットを介してアクセスされるコンピューティング資源の共有に関する。特に、クラウドコンピューティングインフラストラクチャは、個人および／または企業などのユーザが、サーバ、記憶デバイス、ネットワーク、アプリケーション、および／または他のコンピューティングベースのサービスなどのコンピューティング資源の共有プールにアクセスすることを可能にする。そうすることによって、ユーザは、要求に応じて、遠隔の場所に位置するコンピューティング資源にアクセスすることが可能になり、これらの資源は、様々なコンピューティング機能（たとえば、大量のコンピューティングデータの記憶および／または処理）を実行するために使用することができる。企業および他の組織のユーザにとって、クラウドコンピューティングは、私用ネットワークインフラストラクチャの確立に高価なネットワーク機器購入または大量の時間投資などの大きな事前コストを生じることなく、クラウドコンピューティング資源へのアクセスの柔軟性を提供する。代わりに、ユーザは、クラウドコンピューティング資源を利用することによって、企業の中核機能に集中するように自身の資源を向け直すことが可能になる。

【0005】

そのようなクラウドコンピューティングサービスは、クライアントインスタンスのユーザからの自然言語要求に基づいてクライアントインスタンスに伴う問題に自動的に応答するように設計されたチャットエージェントなどの仮想エージェントをホストすることができる。たとえば、ユーザは、パスワードの問題の支援のための要求を仮想エージェントへ提供することができ、仮想エージェントは、自然言語処理（ＮＬＰ）または自然言語理解（ＮＬＵ）システムの一部である。ＮＬＰは、何らかの形態の自然言語入力の処理を伴うコンピュータサイエンスおよびＡＩの一般領域である。ＮＬＰによって対処される領域の例には、言語翻訳、音声生成、解析木抽出、品詞識別などが含まれる。ＮＬＵは、ユーザ発話の理解に特別に焦点を当てたＮＬＰの下位領域である。ＮＬＵによって対処される領域の例には、質問応答（たとえば、読解力の質問）、記事要約などが含まれる。たとえば、ＮＬＵは、人間の言語（たとえば、話し言葉または書き言葉）を、下流の仮想エージェントが消費できる既知の記号セットに縮小するために、アルゴリズムを使用することができる。ＮＬＰは、概して、フリーテキストをさらに分析できるように解釈するために使用される。典型的に、ＮＬＰに対する現在の手法は深層学習に基づいており、これはプログラムの理解を改善するためにデータ内のパターンを試験および使用する一種のＡＩである。

【0006】

しかし、探索空間内で意図および実体の整合を識別するためにＮＬＵ技法を適用する既存の仮想エージェントは、受け取ったユーザ発話から意味を推定し、そのユーザ発話に対して適当な応答を判定しようとするとき、計算資源を拡張しすぎることがある。実際には、意味探索中、特定の既存の手法は、受け取ったユーザ発話に対する意味を導出するために、探索空間内の１群の記憶されたユーザ発話全体に直接問い合わせることがあり、それによって相当な処理およびメモリ資源を長期間にわたって消費することがある。したがって、既存の手法は、ユーザと実時間で関与するために、かつ／または複数のユーザ発話に対して適当な適時応答を同時に生成するために、好適な形で複雑なユーザ発話に効率的に対処することが可能でないことがある。

【発明の概要】

【0007】

本明細書に開示する特定の実施形態の概要について、以下に記載する。これらの態様は、これらの特定の実施形態の簡単な概要を読者に提供するためにのみ提示されており、これらの態様は、本開示の範囲を限定することを意図したものではないことを理解されたい。実際には、本開示は、様々な態様を包含することができるが、そのような態様は、以下に記載されていないこともある。

【0008】

本実施形態は、仮想エージェントによって受け取られた要求などのユーザ発話から意味を抽出し、これらのユーザ発話に好適に応答するように設計されたエージェント自動化フレームワークを対象とする。これらのタスクを実行するために、エージェント自動化フレームワークは、ＮＬＵフレームワークおよび意図－実体モデルを含み、意図－実体モデルは、サンプル発話に伴う定義された意図および実体を有する。ＮＬＵフレームワークは、意図－実体モデルのサンプル発話に対する意味表現を生成するように設計された意味抽出サブシステムを含む。したがって、ＮＬＵフレームワークは、これらの意味表現から探索可能な理解モデルまたは探索空間を生成し、意味表現は各々、根本的な発話の異なる理解または解釈を表す。意味抽出サブシステムはまた、ユーザから受け取られた発話に基づいて意味表現を生成し、ここで意味表現は、探索空間と比較される探索鍵である。したがって、開示するＮＬＵフレームワークの意味探索サブシステムは、受け取ったユーザ発話の意味表現に対する意味表現整合を突き止めるために、理解モデルの意味表現を探索するように設計される。意味抽出サブシステムは、後に、適当なエージェント応答および／または行動を容易にするために、整合意味表現から意図および実体を抽出することができる。

【0009】

意味－探索ベースの本ＮＬＵ技法など、受け取ったユーザ発話から理解を抽出するために探索に大いに依拠するＮＬＵフレームワークの場合、特定の事例では、大きい理解モデルまたはさらには理解モデルの組合せに適用される探索プロセスは、相当数の意味表現を評価することがある。したがって、表面上はユーザ発話の意味表現に適合していない意味表現を除去するように探索空間を剪定することで、ＮＬＵフレームワークがより大きい探索空間を統合し、または探索空間の本実施形態により巧みに対応することを有効にすることができることが現在認識されている。複数の理解モデルから生成された探索空間を利用する実施形態の場合、本明細書に開示する技法は、各々が対応する理解モデルに関連付けられた複数の異なる事業態様（たとえば、販売、建築情報、サービスチケット）を考慮する意味探索に基づいて、改善されたユーザ満足を届けることができる。以下で論じるように、本実施形態は、概して、理解モデル内の整合意味表現の識別を改善するために、類似性スコアリング能力を活用して大きい探索空間を剪定することによって、意味探索サブシステムの動作を改善する。特に、本実施形態は、意味整合プロセスのより早い部分中に低コストでありまたはそれほど資源集約的でない剪定基準を利用して、探索空間を連続して縮小し、次いでサイズが低減された探索空間により資源集約的な剪定基準を適用する。理解されるように、それによって本技法は、探索鍵にあまり関係しない探索空間内の意味表現を評価することに資源を無駄にしない管理しやすくそれほど資源集約的でない探索問題に変換することによって、ＮＬＵに伴う難題に対処する。

【0010】

より具体的には、本実施形態は、受け取ったユーザ発話から導出された意味表現と、意図－実体モデルのサンプル発話から導出された意味表現とを効率的に比較するための意味探索サブシステムの類似性スコアリングサブシステムを対象とする。理解されるように、類似性スコアリングサブシステムは、漸進的な数学的比較関数セットに基づいて、比較される意味表現の各対に対して、類似性スコアを反復して判定する。たとえば、特定の意味表現と理解モデル内の１群の意味表現とを比較するために、類似性スコアリングサブシステムはまず、特定の意味表現に対する認知構文文法（ＣＣＧ）形式を判定することができる。ＣＣＧ技法に記載されているように、特定の意味表現のＣＣＧ形式クラスメンバーシップは、特定の意味表現の発話木構造の形状、ならびにその意味表現のノードの品詞注釈によって設定される。特定の意味表現のＣＣＧ形式に基づいて、類似性スコアリングサブシステムは、次いで、特定の意味表現と理解モデルの意味表現との間の比較を有効にする数学的比較関数リストを検索するために、形式クラスデータベースに問い合わせることができる。さらに、類似性スコアリングサブシステムは、特定の意味表現のＣＣＧ形式に適合しているＣＣＧ形式を有していない理解モデルの意味表現を無視または剪定することができる。

【0011】

本明細書に記載するように、各数学的比較関数リストは、比較されている意味表現のそれぞれの数のノードを反復して考慮する順序付きの１群の比較関数を含む。特に、比較関数は、類似性スコアリングサブシステムが、計算的に最も安価でありかつ／または最も効率的な関数をまず実施し、したがって特定の意味表現と理解モデルの意味表現との間の初期または予備の類似性スコアを判定するように順序付けられている。たとえば、類似性スコアリングサブシステムは、特定の意味表現の根ノードが理解モデルの比較可能な各意味表現の根ノードに好適に類似しているかどうかを考慮するために、初期関数を用いることができる。類似性スコアリングサブシステムは、次いで、好適に類似の意味表現を狭めることができ、その後、後の関数を適用して、各意味表現の根ノードおよび第１の従属ノードを考慮し、または任意の他のより資源集約的な比較関数を適用することができる。したがって、本明細書に記載する選択的なノード露出の反復的適用および／またはより高コストの比較関数の適用により、ますます複雑になる比較関数を介して、比較される意味表現のさらなる特徴を反復して考慮しながら、理解モデルの潜在的整合意味表現候補を絞り込む。したがって、予測的類似性スコアリングのための本技法は、意味表現整合の標的発見を有効にし、それによってＮＬＵなどの生成空間に計算利益を提供し、意味表現サイズ（たとえば、ノードの数）および探索空間サイズを広大なものにすることができる。

【0012】

本開示の様々な態様は、以下の詳細な説明および図面の参照を読めば、よりよく理解されよう。

【図面の簡単な説明】

【0013】

【図1】本技法の実施形態が動作することができるクラウドコンピューティングシステムの一実施形態のブロック図である。

【図2】本技法の実施形態が動作することができるマルチインスタンスクラウドアーキテクチャの一実施形態のブロック図である。

【図3】本技法の態様による、図１または図２に存在することができるコンピューティングシステムで利用されるコンピューティングデバイスのブロック図である。

【図4A】本技法の態様による、クラウドコンピューティングシステムによってホストされるクライアントインスタンスの一部であるＮＬＵフレームワークを含むエージェント自動化フレームワークの一実施形態を示す概略図である。

【図4B】本技法の態様による、ＮＬＵフレームワークのいくつかの部分が、クラウドコンピューティングシステムによってホストされる企業インスタンスの一部である、エージェント自動化フレームワークの代替実施形態を示す概略図である。

【図5】本技法の態様による、ＮＬＵフレームワークおよび挙動エンジンフレームワークを含むエージェント自動化フレームワークが、ユーザ発話から意図および／または実体を抽出してユーザ発話に応答するプロセスの一実施形態を示す流れ図である。

【図6】本技法の態様による、意味抽出サブシステムが、受け取ったユーザ発話から意味表現を生成して、発話意味モデルをもたらし、理解モデルのサンプル発話から意味表現を生成して、理解モデルもたらし、意味探索サブシステムが、発話意味モデルの意味表現と理解モデルの意味表現とを比較して、受け取ったユーザ発話からアーティファクト（たとえば、意図および実体）を抽出する、意味抽出サブシステムおよび意味探索サブシステムを含むＮＬＵフレームワークの一実施形態を示すブロック図である。

【図7】本手法の一実施形態による発話に対して生成された発話木の一例を示す図である。

【図8】本技法の態様による、ＮＬＵフレームワークが受け取ったユーザ発話からアーティファクトを抽出することを有効にする整合意味表現を判定または識別するために、理解モデルによって定義された探索空間を分析する意味探索サブシステムの一実施形態を示す情報の流れ図である。

【図9】本技法の態様による、任意の好適な数の意味表現間の効率的な比較を有効にする数学的比較関数リストを検索するために、ＮＬＵフレームワークの意味探索サブシステム内で実施することができる類似性スコアリングサブシステムの一実施形態を示す情報の流れ図である。

【図10】本技法の態様による、類似性スコアリングサブシステムが、発話ベースの意味表現と図８の探索空間との間の比較を有効にする数学的比較関数リストを検索する、プロセスの一実施形態を示す流れ図である。

【図11】本技法の態様による、意味探索サブシステムの類似性スコアリングサブシステムが、１つの数学的比較関数リストを利用して、第１の意味表現と第２の意味表現とを比較する、一実施形態の図である。

【図12】本技法の態様による、類似性スコアリングサブシステムが、探索空間からの整合意味表現を識別するように、数学的比較関数リストを実施する、プロセスの一実施形態の流れ図である。

【図13】本技法の態様による、類似性スコアリングサブシステムが、数学的比較関数リストを適用して、発話ベースの意味表現に整合する意味表現を識別するための探索空間を選択的に狭める、一実施形態を示す概略図である。

【発明を実施するための形態】

【0014】

１つまたは複数の特有の実施形態について、以下に説明する。これらの実施形態の簡潔な説明を提供するために、実際の実施例の特徴のすべてが本明細書に説明されているとは限らない。そのようなあらゆる実際の実施例の開発において、あらゆる工学または設計計画と同様に、実施例ごとに変動しうるシステム関連および事業関連の制約への準拠などの開発者の特有の目標を実現するために、実施例に特有の多数の決定がされなければならないことを理解されたい。さらに、そのような開発努力は、複雑で時間のかかることがあるが、それにもかかわらず、本開示の利益を有する当業者にとっては、日常的な設計、製作、および製造の業務であることを理解されたい。

【0015】

本明細書では、「コンピューティングシステム」または「コンピューティングデバイス」という用語は、それだけに限定されるものではないが、単一のコンピュータ、仮想マシン、仮想コンテナ、ホスト、サーバ、ラップトップ、および／もしくは移動デバイス、またはコンピューティングシステム上でもしくはコンピューティングシステムによって実行されるものとして記載した機能を実行するようにともに動作する複数の電子コンピューティングデバイスなどの電子コンピューティングデバイスを指す。本明細書では、「機械可読媒体」という用語は、１つまたは複数の命令またはデータ構造を記憶する単一の媒体または複数の媒体（たとえば、集中もしくは分散データベース、ならびに／または関連するキャッシュおよびサーバ）を含むことができる。「非一時的機械可読媒体」という用語はまた、任意の有形の媒体を含むと解釈されるものとし、そのような有形の媒体は、コンピューティングシステムによって実行するための命令の記憶、符号化、もしくは搬送が可能であり、コンピューティングシステムに、本主題の方法のうちのいずれか１つもしくは複数を実行させ、またはそのような命令によって利用されもしくはそのような命令に関連するデータ構造の記憶、符号化、もしくは搬送が可能である。したがって、「非一時的機械可読媒体」という用語は、それだけに限定されるものではないが、固体状態メモリならびに光および磁気媒体を含むと解釈されるものとする。非一時的機械可読媒体の特有の例には、それだけに限定されるものではないが、例として、半導体メモリデバイス（たとえば、消去可能プログラマブル読出し専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラマブル読出し専用メモリ（ＥＥＰＲＯＭ）、およびフラッシュメモリデバイス）、内部ハードディスクおよび取外し可能ディスク、光磁気ディスク、ならびにＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスクなどの磁気ディスクを含む不揮発性メモリが含まれる。

【0016】

本明細書では、「アプリケーション」、「エンジン」、および「プラグイン」という用語は、特定の機能を提供するためにコンピューティングシステムの１つまたは複数のプロセッサによって実行可能な１つまたは複数のコンピュータソフトウェア命令セット（たとえば、コンピュータプログラムおよび／またはスクリプト）を指す。コンピュータソフトウェア命令は、Ｃ、Ｃ＋＋、Ｃ＃、Ｐａｓｃａｌ、Ｆｏｒｔｒａｎ、Ｐｅｒｌ、ＭＡＴＬＡＢ（登録商標）、ＳＡＳ、ＳＰＳＳ、ＪａｖａＳｃｒｉｐｔ（登録商標）、ＡＪＡＸ、およびＪＡＶＡ（登録商標）などの任意の好適なプログラミング言語で書くことができる。そのようなコンピュータソフトウェア命令は、データ入力およびデータ表示モジュールを有する独立したアプリケーションを含むことができる。別法として、開示するコンピュータソフトウェア命令は、分散オブジェクトにインスタンス化されたクラスとすることができる。開示するコンピュータソフトウェア命令はまた、コンポーネントソフトウェア、たとえばＪＡＶＡＢＥＡＮＳ（登録商標）またはＥＮＴＥＲＰＲＩＳＥＪＡＶＡＢＥＡＮＳ（登録商標）とすることができる。加えて、開示するアプリケーションまたはエンジンは、コンピュータソフトウェア、コンピュータハードウェア、またはこれらの組合せで実施することができる。

【0017】

本明細書では、「フレームワーク」という用語は、１つまたは複数の全体的な機能を実行するように協働するアプリケーションおよび／またはエンジン、および任意の他の支持データ構造、ライブラリ、モジュール、ならびに任意の他の支持機能のシステムを指す。特に、「自然言語理解フレームワーク」または「ＮＬＵフレームワーク」は、理解モデルに基づいて、自然言語発話から意味（たとえば、意図、実体、アーティファクト）を処理および導出するように設計された１群のコンピュータプログラムを含む。本明細書では、「挙動エンジン」または「ＢＥ」は、推論エージェントまたはＲＡ／ＢＥとしても知られており、会話モデルに基づいてユーザと対話するように設計された仮想エージェントなどの規則ベースのエージェントを指す。たとえば、「仮想エージェント」は、特定の会話または通信チャネルにおける自然言語要求を介してユーザと対話するように設計されたＢＥの特定の例を指すことができる。これを念頭に、「仮想エージェント」および「ＢＥ」という用語は、本明細書では区別なく使用される。特有の例として、仮想エージェントは、チャットルーム環境において自然言語要求を介してユーザと対話および応答するチャットエージェントとすることができ、またはそのようなチャットエージェントを含むことができる。仮想エージェントの他の例には、電子メール、フォーラムポスト、サービスチケットへの自動返信、通話などのコンテキストにおいてユーザと対話する電子メールエージェント、フォーラムエージェント、チケッティングエージェント、通話エージェントなどを含むことができる。

【0018】

本明細書では、「意図」は、発話などの通信の根本的な目的に関係しうるユーザの要望または目標を指す。本明細書では、「実体」は、目的、対象、または何らかの他の意図のパラメータ化を指す。本実施形態では、特定の実体が、対応する意図のパラメータとして扱われることに留意されたい。より具体的には、特定の実体（たとえば、時間および場所）は、すべての意図に対して広範に認識および抽出することができ、他の実体は、意図に特定的であり（たとえば、購入意図に関連する商品実体）、概してそれらを定義する意図の範囲内で見られたときにのみ抽出される。本明細書では、「アーティファクト」は、集合的に、発話の意図および実体の両方を指す。本明細書では、「理解モデル」は、自然言語発話の意味を推論するためにＮＬＵフレームワークによって使用される１群のモデルである。理解モデルは、特定のトークン（たとえば、単語またはフレーズ）を特定の単語ベクトル、意図－実体モデル、実体モデル、またはこれらの組合せに関連付ける語彙モデルを含むことができる。本明細書では、「意図－実体モデル」は、特定の意図を特定のサンプル発話に関連付けるモデルを指し、意図に関連付けられた実体は、モデルのサンプル発話内の意図のパラメータとして符号化することができる。本明細書では、「エージェント」という用語は、会話チャネル内でユーザと対話するコンピュータ生成ペルソナ（たとえば、チャットエージェントまたは他の仮想エージェント）を指すことができる。本明細書では、「コーパス」は、様々なユーザおよび仮想エージェント間の対話を含む捕捉された一連のソースデータを指し、対話は、１つまたは複数の好適なタイプの媒体（たとえば、ヘルプライン、チャットルーム、またはメッセージ列、電子メール列）内の通信または会話を含む。本明細書では、「発話木」は、発話の意味表現を記憶するデータ構造を指す。論じるように、発話木は、発話の構文および文法構造（たとえば、単語間や品詞タギング間の関係）を表す木構造（たとえば、依存性解析木構造）を有し、木構造のノードは、発話の意味論的意味を符号化するベクトル（たとえば、単語ベクトル、部分木ベクトル）を記憶する。

【0019】

本明細書では、「ソースデータ」または「会話ログ」は、様々なエージェントとユーザとの間の任意の好適な捕捉された対話を含むことができ、そのような対話には、それだけに限定されるものではないが、チャットログ、電子メール列、文書、文書化ヘルプ、よくある質問（ＦＡＱ）、フォーラムエントリ、サポートチケッティングのアイテム、ヘルプライン通話の記録などが含まれる。本明細書では、「発話」は、１つまたは複数の意図を含むことができるユーザまたはエージェントによってなされた単一の自然言語発言を指す。したがって、発話は、事前に捕捉されたソースデータのコーパスの一部とすることができ、発話はまた、仮想エージェントとの対話の一部としてユーザから受け取った新しい発言とすることができる。本明細書では、「機械学習」または「ＭＬ」は、教師あり、教師なし、および半教師ありの学習技法を含む機械学習技法を使用して訓練することが可能な任意の好適な統計的な形態の人工知能を指すために使用することができる。たとえば、特定の実施形態では、ＭＬ技法は、ニューラルネットワーク（ＮＮ）（たとえば、ディープニューラルネットワーク（ＤＮＮ）、回帰型ニューラルネットワーク（ＲＮＮ）、再帰型ニューラルネットワーク）を使用して実施することができる。本明細書では、「ベクトル」（たとえば、単語ベクトル、意図ベクトル、対象ベクトル、部分木ベクトル）は、発話の一部分（たとえば、単語またはフレーズ、意図、実体、トークン）の意味論的意味の数学表現を提供する浮動小数点値の順序付きのｎ次元リスト（たとえば、３００次元リスト）（たとえば、１×ＮまたはＮ×１行列）である線形代数ベクトルを指す。本明細書では、「ドメイン特異性」は、所与のドメインおよび／または会話チャネル内の実際の会話で表される意図および実体を正確に抽出するためにシステムがどれだけ調和されるかを指す。本明細書では、発話の「理解」は、ＮＬＵフレームワークによる発話の解釈または構造を指す。したがって、発話の異なる理解を、異なる構造（たとえば、異なるノード、ノード間の異なる関係）、異なる品詞タギングなどを有する異なる意味表現に関連付けることができることが理解されよう。

【0020】

上述したように、コンピューティングプラットホームは、ＮＬＵ技法を介してプラットホーム上で機能を実行しまたは問題に対処するためのユーザ要求に自動的に応答するように設計されたチャットエージェントまたは別の類似の仮想エージェントを含むことができる。開示するＮＬＵフレームワークは、認知構文文法（ＣＣＧ）の原理に基づいており、自然言語発話の意味または理解の態様は、発話の形式（たとえば、構文構造、形状）および意味論的意味に基づいて判定することができる。開示するＮＬＵフレームワークは、発話に対して複数の意味表現を生成することが可能であり、各意味表現は、発話の特定の理解を表す発話木とすることができる。したがって、開示するＮＬＵフレームワークは、特定のサンプル発話に対して複数の意味表現を有する理解モデルを生成することが可能であり、意味探索の探索空間を拡大し、それによってＮＬＵフレームワークの動作を改善する。しかし、自然言語発話からユーザの意図を導出しようとするとき、特定のＮＬＵフレームワークは、ユーザベースの発話の意味表現に比較可能でないかつ／または類似していない意味表現が含まれるため、過度に大きいサイズの探索空間上で探索を実行する可能性があることが現在認識されている。したがって、探索空間全体に対して、特定のＮＬＵフレームワークは、未適合または単一コストの比較関数を利用することがあり、探索空間が利用可能な処理およびメモリ資源に基づく特定のスケール閾値を上回るため、意味探索の性能が制限される。

【0021】

したがって、本実施形態は、概して、意味探索を強化するためにＣＣＧ技法を活用するように設計された意味探索サブシステムを有するエージェント自動化フレームワークを対象とする。本明細書に論じるように、意味探索サブシステムは、整合意味表現に関して探査される探索空間を反復して累進的に狭めることが可能である。実際には、これらの整合意味表現は、受け取ったユーザ発話に対する意図または実体整合の識別を有効にする探索空間の部分集合を定義する。より具体的には、本実施形態は、受け取ったユーザ発話に基づいて判定された意味表現と、探索空間を定義するサンプル発話の意味表現とを効率的に比較する意味探索サブシステムの類似性スコアリングサブシステムを対象とする。理解されるように、漸進的な数学的比較関数セットに基づいて、類似性スコアリングサブシステムは、比較される１対の意味表現間で累進的に正確になる類似性スコアを反復して判定し、類似性スコアの様々な反復に基づいて探索空間を剪定する。

【0022】

たとえば、特定の意味表現と探索空間を定義する１群の意味表現とを比較するために、類似性スコアリングサブシステムはまず、特定の意味表現に対してＣＣＧ形式を判定することができる。前述のように、特定の各意味表現のＣＣＧ形式クラスメンバーシップは、特定の意味表現の木構造（たとえば、発話木）を形成するノードの形状および意味論的意味によって設定される。特定の意味表現のＣＣＧ形式に基づいて、類似性スコアリングサブシステムは、それぞれの対の意味表現間の定量的な比較を有効にする数学的比較関数リストを検索するために、形式クラスデータベースに問い合わせるように設計される。実際には、数学的比較関数リストは、特定の意味表現および探索空間の意味表現のそれぞれの部分間の類似性のどれだけますます正確かつ／または精密な判定を実行することができるかを個々に指定する入れ子関数を含む。比較される１対の意味表現が数学的比較関数リストを有していない場合、類似性スコアリングサブシステムは、関連付けられた意味表現を探索空間から剪定し（たとえば、いかなる比較も実行することなく、可能な限り最も低いスコアをすぐに判定する）、残りの潜在的整合意味表現のために資源使用を節約することができる。

【0023】

より詳細には、各数学的比較関数リストは、比較されているそれぞれの意味表現のノードの少なくとも一部分を考慮する順序付きの１群の比較関数（たとえば、ベクトル代数、コサイン類似性、累進関数、他のデータベースまたは構造の呼出し）を含む。本明細書で認識されるように、比較関数は、類似性スコアリングサブシステムが、計算的に最も安価かつ／またはもっと効率的な比較をまず実行することを有効にするように順序付けされている。類似性スコアリングサブシステムは、特定の意味表現と探索空間内に残っている比較可能な意味表現との間の初期類似性スコアを判定することができる。たとえば、類似性スコアリングサブシステムは、特定の意味表現が探索空間内の各意味表現に好適に類似しているかどうかを考慮するために、計算的に最も安価な関数を用いることができる。この判定は、概して、探索空間のどの領域がさらなる調査に値するかを示す最も正確でないが最も効率的な予測を提供することができる。類似性スコアリングサブシステムは、次いで、類似していない意味表現を探索空間から剪定してから、後の関数を適用して、残りの比較可能な各対の比較された意味表現をさらに考慮することができる。したがって、比較関数の漸進的なデータ活用により、類似性スコアリングサブシステムは、ますます複雑になる比較関数を介して、比較された意味表現の追加の特徴を反復して考慮しながら、探索空間を潜在的整合候補に狭めることが有効になる。したがって、予測的類似性スコアリングのための本技法は、意味表現整合の標的発見を有効にし、それによって計算利益を提供して、これらの技法を実施するエージェント自動化システムに対する効率を改善し、計算経費を低減させる。加えて、エージェント自動化システムの探索容量が増大されることから、自然言語エージェント応答がエージェント自動化システムに対応する事業の複数の異なる面に対処することを有効にするために、複数の理解モデルから探索空間を構築することができる。

【0024】

上記を念頭に、以下の図は、マルチインスタンスフレームワーク内の組織へサービスを提供するために用いることができ、本手法を用いることができる、様々なタイプの概略的なシステムアーキテクチャまたは構成に関する。それに対応して、これらのシステムおよびプラットホーム例はまた、本明細書に論じる技法を実施しまたは他の形で利用することができるシステムおよびプラットホームに関することができる。図１を次に参照すると、本開示の実施形態が動作することができるクラウドコンピューティングシステム１０の一実施形態の概略図が示されている。クラウドコンピューティングシステム１０は、クライアントネットワーク１２、ネットワーク１８（たとえば、インターネット）、およびクラウドベースのプラットホーム２０を含むことができる。いくつかの実施例では、クラウドベースのプラットホーム２０は、構成管理データベース（ＣＭＤＢ）プラットホームとすることができる。一実施形態では、クライアントネットワーク１２は、それだけに限定されるものではないが、スイッチ、サーバ、およびルータを含む、様々なネットワークデバイスを有するローカルエリアネットワーク（ＬＡＮ）などのローカル私用ネットワークとすることができる。別の実施形態では、クライアントネットワーク１２は、１つまたは複数のＬＡＮ、仮想ネットワーク、データセンタ２２、および／または他の遠隔のネットワークを含みうる企業ネットワークを表す。図１に示すように、クライアントネットワーク１２は、１つまたは複数のクライアントデバイス１４Ａ、１４Ｂ、および１４Ｃに接続することが可能であり、したがってクライアントデバイスは、互いに通信しかつ／またはプラットホーム２０をホストするネットワークと通信することが可能である。クライアントデバイス１４は、全体としてモノのインターネット（ＩｏＴ）デバイスと呼ばれるコンピューティングシステムおよび／または他のタイプのコンピューティングデバイスとすることができ、そのようなデバイスは、たとえばウェブブラウザアプリケーションを介して、またはクライアントデバイス１４とプラットホーム２０との間のゲートウェイとして作用することができるエッジデバイス１６を介して、クラウドコンピューティングサービスにアクセスする。図１はまた、クライアントネットワーク１２が、プラットホーム２０、他の外部アプリケーション、データソース、およびサービスをホストするネットワークと、クライアントネットワーク１２との間のデータの通信を容易にする、管理、計測、および発見（ＭＩＤ）サーバ１７などの運営または管理デバイス、エージェント、またはサーバを含むことを示す。図１には具体的に示されていないが、クライアントネットワーク１２はまた、接続ネットワークデバイス（たとえば、ゲートウェイまたはルータ）、または顧客ファイアウォールもしくは侵入保護システムを実施するデバイスの組合せを含むことができる。

【0025】

図示の実施形態では、図１は、クライアントネットワーク１２がネットワーク１８に結合されることを示す。ネットワーク１８は、クライアントデバイス１４Ａ～１４Ｃとプラットホーム２０をホストするネットワークとの間でデータを伝達するために、他のＬＡＮ、ワイドエリアネットワーク（ＷＡＮ）、インターネット、および／または他の遠隔ネットワークなどの１つまたは複数のコンピューティングネットワークを含むことができる。ネットワーク１８内のコンピューティングネットワークの各々は、電気および／または光学ドメインで動作する有線および／または無線のプログラマブルデバイスを含むことができる。たとえば、ネットワーク１８は、セルラーネットワーク（たとえば、ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ（ＧＳＭ）ベースのセルラーネットワーク）、ＩＥＥＥ８０２．１１ネットワーク、および／または他の好適な無線ベースのネットワークなどの無線ネットワークを含むことができる。ネットワーク１８はまた、伝送制御プロトコル（ＴＣＰ）およびインターネットプロトコル（ＩＰ）などの任意の数のネットワーク通信プロトコルを用いることができる。図１には明示的に示されていないが、ネットワーク１８は、ネットワーク１８を介してデータを輸送するように構成されたサーバ、ルータ、ネットワークスイッチ、および／または他のネットワークハードウェアデバイスなどの様々なネットワークデバイスを含むことができる。

【0026】

図１で、プラットホーム２０をホストするネットワークは、クライアントネットワーク１２およびネットワーク１８を介してクライアントデバイス１４と通信することが可能な遠隔ネットワーク（たとえば、クラウドネットワーク）とすることができる。プラットホーム２０をホストするネットワークは、クライアントデバイス１４および／またはクライアントネットワーク１２に追加のコンピューティング資源を提供する。たとえば、プラットホーム２０をホストするネットワークを利用することによって、クライアントデバイス１４のユーザは、様々な企業、ＩＴ、および／または他の組織関連の機能のためのアプリケーションを構築および実行することが可能になる。一実施形態では、プラットホーム２０をホストするネットワークは、１つまたは複数のデータセンタ２２上で実施され、各データセンタは、異なる地理的な場所に対応することができる。データセンタ２２の各々は、複数の仮想サーバ２４（本明細書では、アプリケーションノード、アプリケーションサーバ、仮想サーバインスタンス、アプリケーションインスタンス、またはアプリケーションサーバインスタンスとも呼ぶ）を含み、各仮想サーバ２４は、単一の電子コンピューティングデバイス（たとえば、単一の物理ハードウェアサーバ）などの物理コンピューティングシステム上で実施することができ、または複数のコンピューティングデバイス（たとえば、複数の物理ハードウェアサーバ）にわたって実施することができる。仮想サーバ２４の例には、それらだけに限定されるものではないが、ウェブサーバ（たとえば、単体のＡｐａｃｈｅの導入）、アプリケーションサーバ（たとえば、単体のＪＡＶＡ仮想マシン）、および／またはデータベースサーバ（たとえば、単体の関係データベース管理システム（ＲＤＢＭＳ）カタログ）が含まれる。

【0027】

プラットホーム２０内でコンピューティング資源を利用するために、ネットワークオペレータは、様々なコンピューティングインフラストラクチャを使用して、データセンタ２２を構成することを選ぶことができる。一実施形態では、データセンタ２２のうちの１つまたは複数は、サーバインスタンス２４のうちの１つが複数の顧客からの要求を取り扱って複数の顧客を担当するように、マルチテナントクラウドアーキテクチャを使用して構成される。マルチテナントクラウドアーキテクチャを有するデータセンタ２２は、複数の顧客からのデータを混ぜ合わせて記憶し、複数の顧客インスタンスが、仮想サーバ２４のうちの１つに割り当てられる。マルチテナントクラウドアーキテクチャでは、特定の仮想サーバ２４は、様々な顧客のデータおよび他の情報を区別して分離する。たとえば、マルチテナントクラウドアーキテクチャは、各顧客からデータを識別して分離するために、各顧客に対する特定の識別子を割り当てることができる。概して、マルチテナントクラウドアーキテクチャを実施すると、サーバインスタンス２４のうちの特定のサーバインスタンス２４の障害が、特定のサーバインスタンスに割り当てられたすべての顧客に対して機能停止を引き起こすなど、様々な欠点が生じる可能性がある。

【0028】

別の実施形態では、データセンタ２２のうちの１つまたは複数は、すべての顧客に１つまたは複数の固有の顧客インスタンスを提供するように、マルチインスタンスクラウドアーキテクチャを使用して構成される。たとえば、マルチインスタンスクラウドアーキテクチャは、各顧客インスタンスに、独自の専用のアプリケーションサーバおよび専用のデータベースサーバを提供することができる。他の例では、マルチインスタンスクラウドアーキテクチャは、各顧客インスタンスに対して、１つまたは複数の専用のウェブサーバ、１つまたは複数の専用のアプリケーションサーバ、および１つまたは複数のデータベースサーバなど、単一の物理もしくは仮想サーバ２４、ならびに／または物理および／もしくは仮想サーバ２４の他の組合せを配備することができる。マルチインスタンスクラウドアーキテクチャでは、１つまたは複数のそれぞれのハードウェアサーバ上に、複数の顧客インスタンスを導入することができ、各顧客インスタンスには、コンピューティングメモリ、記憶、および処理電力などの物理サーバ資源の特定の部分が割り当てられる。そうすることによって、各顧客インスタンスは、固有のソフトウェアスタックを有し、それによりデータ分離、顧客がプラットホーム２０にアクセスするための比較的短いダウンタイム、および顧客によって駆動されるアップグレードスケジュールの利益が提供される。マルチインスタンスクラウドアーキテクチャ内で顧客インスタンスを実施する一例について、図２を参照して以下により詳細に論じる。

【0029】

図２は、本開示の実施形態が動作することができるマルチインスタンスクラウドアーキテクチャ４０の一実施形態の概略図である。図２は、マルチインスタンスクラウドアーキテクチャ４０が、互いに地理的に分離することができる２つの（たとえば、対の）データセンタ２２Ａおよび２２Ｂに接続するクライアントネットワーク１２およびネットワーク１８を含むことを示す。図２を一例として使用すると、ネットワーク環境およびサービスプロバイダクラウドインフラストラクチャのクライアントインスタンス４２（本明細書では、クライアントインスタンス４２とも呼ぶ）が、専用の仮想サーバ（たとえば、仮想サーバ２４Ａ、２４Ｂ、２４Ｃ、および２４Ｄ）および専用のデータベースサーバ（たとえば、仮想データベースサーバ４４Ａおよび４４Ｂ）に関連付けられる（たとえば、対応されて有効にされる）。言い換えれば、仮想サーバ２４Ａ～２４Ｄならびに仮想データベースサーバ４４Ａおよび４４Ｂは、他のクライアントインスタンスによって共有されず、それぞれのクライアントインスタンス４２に特異である。図示の例では、クライアントインスタンス４２の利用可能性を促進するために、仮想サーバ２４Ａ～２４Ｄならびに仮想データベースサーバ４４Ａおよび４４Ｂは、２つの異なるデータセンタ２２Ａおよび２２Ｂに割り当てられ、したがってデータセンタ２２のうちの１つが、バックアップデータセンタとして作用する。マルチインスタンスクラウドアーキテクチャ４０の他の実施形態は、ウェブサーバなどの他のタイプの専用の仮想サーバを含むことができる。たとえば、クライアントインスタンス４２は、専用の仮想サーバ２４Ａ～２４Ｄ、専用の仮想データベースサーバ４４Ａおよび４４Ｂ、ならびに追加の専用の仮想ウェブサーバ（図２には図示せず）に関連付けることができる（たとえば、対応されて有効にされる）。

【0030】

図１および図２は、それぞれクラウドコンピューティングシステム１０およびマルチインスタンスクラウドアーキテクチャ４０の特有の実施形態を示すが、本開示は、図１および図２に示す特有の実施形態に限定されるものではない。たとえば、図１は、プラットホーム２０がデータセンタを使用して実施されることを示すが、プラットホーム２０の他の実施形態は、データセンタに限定されるものではなく、他のタイプの遠隔ネットワークインフラストラクチャを利用することもできる。さらに、本開示の他の実施形態は、１つまたは複数の異なる仮想サーバを組み合わせて単一の仮想サーバにすることができ、または逆に、複数の仮想サーバを使用して、単一の仮想サーバに起因する動作を実行することもできる。たとえば、図２を一例として使用すると、仮想サーバ２４Ａ、２４Ｂ、２４Ｃ、２４Ｄおよび仮想データベースサーバ４４Ａ、４４Ｂを組み合わせて単一の仮想サーバにすることができる。さらに、本手法は、それだけに限定されるものではないが、本明細書に論じる動作のいくつかまたはすべてを実行するように構成されたマルチテナントアーキテクチャ、概略的なクライアント／サーバの実施例、および／または単一の物理プロセッサベースのデバイスを含む他のアーキテクチャまたは構成で実施することができる。同様に、実施例の議論を容易にするために、仮想サーバまたは機械を参照することがあるが、代わりに物理サーバを適宜用いることもできる。図１および図２の使用および議論は、記載および説明を容易にするための単なる例であり、これらの図に示す特有の例に本開示を限定することを意図したものではない。

【0031】

理解することができるように、図１および図２に関連して論じるそれぞれのアーキテクチャおよびフレームワークは、全体にわたって、様々なタイプのコンピューティングシステム（たとえば、サーバ、ワークステーション、クライアントデバイス、ラップトップ、タブレットコンピュータ、セルラー電話など）を組み込む。完全を期すために、そのようなシステムで典型的に見られる構成要素の簡単な高レベルの概要を提供する。理解することができるように、本概要は、そのようなコンピューティングシステムで典型的な構成要素についての高レベルの概略的な考えを提供することだけを意図したものであり、論じる構成要素または議論から省略した構成要素に関して限定すると見なされるべきではない。

【0032】

背景として、本手法は、図３などに示す１つまたは複数のプロセッサベースのシステムを使用して実施することができることが理解されよう。同様に、本手法で利用されるアプリケーションおよび／またはデータベースは、そのようなプロセッサベースのシステム上で記憶、利用、および／または維持することができる。理解することができるように、図３に示すそのようなシステムは、分散されたコンピューティング環境、ネットワーク化された環境、または他の複数のコンピュータを含むプラットホームもしくはアーキテクチャに存在することができる。同様に、図３に示すものなどのシステムは、本手法を実施することができる１つもしくは複数の仮想環境もしくは計算インスタンスに対応する状態、またはそのような仮想環境もしくは計算インスタンスと通信する状態で使用することができる。

【0033】

これを念頭に、例示的なコンピュータシステムは、図３に示すコンピュータ構成要素のいくつかまたはすべてを含むことができる。図３は、全体として、コンピューティングシステム８０の例示的な構成要素、および１つまたは複数のバスなどに沿ったそれらの潜在的な相互接続または通信経路のブロック図を示す。図示のように、コンピューティングシステム８０は、それだけに限定されるものではないが、１つもしくは複数のプロセッサ８２、１つもしくは複数のバス８４、メモリ８６、入力デバイス８８、電源９０、ネットワークインターフェース９２、ユーザインターフェース９４、および／または本明細書に記載する機能を実行するのに有用な他のコンピュータ構成要素など、様々なハードウェア構成要素を含むことができる。

【0034】

１つまたは複数のプロセッサ８２は、メモリ８６に記憶された命令を実行することが可能な１つまたは複数のマイクロプロセッサを含むことができる。追加または別法として、１つまたは複数のプロセッサ８２は、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、および／またはメモリ８６から命令を呼び出すことなく本明細書に論じる機能のいくつかもしくはすべてを実行するように設計された他のデバイスを含むことができる。

【0035】

他の構成要素に対して、１つまたは複数のバス８４は、コンピューティングシステム８０の様々な構成要素間にデータおよび／または電力を提供するために、好適な電気チャネルを含む。メモリ８６は、任意の有形の非一時的コンピュータ可読記憶媒体を含むことができる。図１には単一のブロックとして示されているが、メモリ８６は、１つまたは複数の物理的な場所において、同じまたは異なるタイプの複数の物理ユニットを使用して実施することができる。入力デバイス８８は、１つまたは複数のプロセッサ８２へデータおよび／またはコマンドを入力するための構造に対応する。たとえば、入力デバイス８８は、マウス、タッチパッド、タッチスクリーン、キーボードなどを含むことができる。電源９０は、回線電力および／または電池ソースなど、コンピューティングデバイス８０の様々な構成要素の任意の好適な電源とすることができる。ネットワークインターフェース９２は、１つまたは複数のネットワーク（たとえば、通信チャネル）を介して他のデバイスと通信することが可能な１つまたは複数のトランシーバを含む。ネットワークインターフェース９２は、有線ネットワークインターフェースまたは無線ネットワークインターフェースを提供することができる。ユーザインターフェース９４は、１つまたは複数のプロセッサ８２との間で伝達されるテキストまたは画像を表示するように構成されたディスプレイを含むことができる。ディスプレイに対する追加および／または代替として、ユーザインターフェース９４は、ライト（たとえば、ＬＥＤ）、スピーカなど、ユーザと連係するための他のデバイスを含むことができる。

【0036】

上記に論じたクラウドベースのプラットホーム２０は、ＮＬＵ技術を利用することができるアーキテクチャの一例を提供することを理解されたい。特に、クラウドベースのプラットホーム２０は、大規模なソースデータコーパスを含みまたは記憶することができ、そのようなコーパスは、意図－実体モデルを含む複数の出力の生成を容易にするために採掘することができる。たとえば、クラウドベースのプラットホーム２０は、特定のシステムの変更または修理のための要求、要求者と問題に対処しようとするサービス技師または管理者との間のダイアログ、チケットが最終的にどのように解決されたかについての説明などを有するチケッティングソースデータを含むことができる。次いで、生成された意図－実体モデルは、将来の要求における意図を分類するための基礎として働くことができ、ユーザからの自然言語要求に基づいてクラウドベースのプラットホーム２０内で将来の問題に自動的に対処することができる仮想エージェントに対応するように会話モデルを生成および改善するために使用することができる。したがって、本明細書に記載する特定の実施形態では、開示するエージェント自動化フレームワークは、クラウドベースのプラットホーム２０に組み込まれており、他の実施形態では、以下に論じるように、エージェント自動化フレームワークは、発話を処理するようにクラウドベースのプラットホーム２０に通信可能に結合された好適なシステムによって（クラウドベースのプラットホーム２０とは別個に）ホストおよび実行することができる。

【0037】

上記を念頭に、図４Ａは、クライアントインスタンス４２に関連するエージェント自動化フレームワーク１００（本明細書では、エージェント自動化システム１００とも呼ぶ）を示す。より具体的には、図４Ａは、上記で論じたクラウドベースのプラットホーム２０を含む、サービスプロバイダクラウドインフラストラクチャの一部分の一例を示す。クラウドベースのプラットホーム２０は、クライアントインスタンス４２内で実行されるネットワークアプリケーションに（たとえば、クライアントデバイス１４Ｄのウェブブラウザを介して）ユーザインターフェースを提供するように、ネットワーク１８を介してクライアントデバイス１４Ｄに接続される。クライアントインスタンス４２は、図２に関して説明したものに類似した仮想サーバによって対応され、ここでは、クライアントインスタンス４２内で本明細書に記載する開示の機能に対応することを示すように示されている。クラウドプロバイダインフラストラクチャは概して、クライアントデバイス１４Ｄなどの複数のエンドユーザデバイスに同時に対応するように構成され、各エンドユーザデバイスは、単一のクライアントインスタンス４２と通信している。また、クラウドプロバイダインフラストラクチャは、クライアントインスタンス４２などの任意の数のクライアントインスタンスに同時に対応するように構成することができ、インスタンスの各々は、１つまたは複数のエンドユーザデバイスと通信している。上述したように、エンドユーザはまた、ウェブブラウザ内で実行されるアプリケーションを使用して、クライアントインスタンス４２と連係することができる。

【0038】

図４Ａに示すエージェント自動化フレームワーク１００の実施形態は、挙動エンジン（ＢＥ）１０２、ＮＬＵフレームワーク１０４、およびデータベース１０６を含み、これらはクライアントインスタンス４２内で通信可能に結合される。ＢＥ１０２は、自然言語ユーザ要求１２２（本明細書では、ユーザ発話１２２または発話１２２とも呼ぶ）およびエージェント応答１２４（本明細書では、エージェント発話１２４とも呼ぶ）を介してクライアントデバイス１４Ｄのユーザと対話する任意の好適な数の仮想エージェントまたはペルソナをホストしまたは含むことができる。実際の実施例では、エージェント自動化フレームワーク１００は、本開示による意味抽出サブシステム、意味探索サブシステムなどを含む複数の他の好適な構成要素を含むことができることに留意されたい。

【0039】

図４Ａに示す実施形態では、データベース１０６は、データベースサーバインスタンス（たとえば、図２に関して論じたデータベースサーバインスタンス４４Ａまたは４４Ｂ）、または１群のデータベースサーバインスタンスとすることができる。図示のデータベース１０６は、データベース１０６の１つまたは複数のテーブル（たとえば、関係データベーステーブル）内に、意図－実体モデル１０８、会話モデル１１０、発話コーパス１１２、および１群の規則１１４を記憶する。意図－実体モデル１０８は、特定のサンプル発話を介して、特定の意図と特定の実体との間の関連または関係を記憶する。特定の実施形態では、意図－実体モデル１０８は、設計者が好適な作成ツールを使用して作成することができる。他の実施形態では、エージェント自動化フレームワーク１００は、データベース１０６の１つまたは複数のテーブルに記憶された発話コーパス１１２および１群の規則１１４から、意図－実体モデル１０８を生成する。いくつかの実施形態では、意図－実体モデル１０８はまた、作成された技法およびＭＬ技法の組合せに基づいて判定することができる。いずれにせよ、開示する意図－実体モデル１０８は、意図および／または実体の任意の好適な組合せを、発話コーパス１１２のうちのそれぞれの発話コーパス１１２に関連付けることができることを理解されたい。以下に論じる実施形態では、意図－実体モデル１０８のサンプル発話は、理解モデルの意味表現を生成して、意味探索に対する探索空間を定義するために使用される。

【0040】

図４Ａに示す実施形態では、会話モデル１１０は、意図－実体モデル１０８の意図と、概してＢＥ１０２の挙動を定義する特定の応答および／または行動との間の関連を記憶する。特定の実施形態では、会話モデル内の関連の少なくとも一部分は、設計者が、処理された発話内の特定の識別されたアーティファクトにＢＥ１０２がどのように応答することを望むかに基づいて、ＢＥ１０２の設計者によって手動で作成または事前定義される。異なる実施形態では、データベース１０６は、コンパイルモデルテンプレートデータ（たとえば、クラス互換性規則、クラスレベルスコアリング係数、木モデル比較アルゴリズム、木下位構造ベクトル化アルゴリズム）、意味表現などに関する情報を記憶するテーブルなど、意図分類に関係する他の情報を記憶する他のデータベーステーブルを含むことができることに留意されたい。

【0041】

図示の実施形態では、ＮＬＵフレームワーク１０４は、ＮＬＵエンジン１１６および語彙マネージャ１１８を含む。ＮＬＵフレームワーク１０４は、任意の好適な数の他の構成要素を含むことができることが理解されよう。特定の実施形態では、ＮＬＵエンジン１１６は、発話の単語またはフレーズから単語ベクトル（たとえば、意図ベクトル、対象または実体ベクトル、部分木ベクトル）を生成すること、ならびにこれらのベクトル間の距離（たとえば、ユークリッド距離）を判定することを含む、ＮＬＵフレームワーク１０４の複数の機能を実行するように設計される。たとえば、ＮＬＵエンジン１１６は、概して、分析された発話の各意図に対して、それぞれの意図ベクトルを作り出すことが可能である。したがって、２つの意図に対してＮＬＵエンジン１１６によって作り出されたそれぞれの意図ベクトルを使用して、２つの異なる発話間の類似性測度または距離を計算することができ、類似性測度は、２つの意図間の意味の類似性の指示を提供する。

【0042】

語彙マネージャ１１８は、語彙訓練中にＮＬＵフレームワーク１０４によって遭遇されなった語彙外の単語および記号に対処する。たとえば、特定の実施形態では、語彙マネージャ１１８は、エージェント自動化フレームワーク１００によって（たとえば、１群の規則１１４に基づいて）分析された発話内の単語および頭字語の同義語およびドメイン特有の意味を識別および交換することができ、それによりコンテキスト特有の発話内の意図および実体を適切に識別するように、ＮＬＵフレームワーク１０４の性能を改善することができる。加えて、自然言語の傾向に対応して、既存の単語に対する新しい用法を採用するために、特定の実施形態では、語彙マネージャ１１８は、コンテキストの変化に基づいて、他の意図または実体に以前に関連付けられた単語を別の目的で利用するように取り扱う。たとえば、語彙マネージャ１１８は、特定のクライアントインスタンスおよび／または会話チャネルからの発話のコンテキストにおいて、「バイク（ｂｉｋｅ）」という単語が、実際には自転車ではなくモータサイクルを指す状況を取り扱うことができる。

【0043】

意図－実体モデル１０８および会話モデル１１０が作成された後、エージェント自動化フレームワーク１００は、ユーザ発話１２２（自然言語要求の形態）を受け取り、その要求に対処するために適当な行動をとるように設計される。たとえば、図４Ａに示す実施形態では、ＢＥ１０２は、ネットワーク１８を介して、クライアントネットワーク１２上に配置されたクライアントデバイス１４Ｄによって提出される発話１２２（たとえば、チャット通信における自然言語要求）を受け取る仮想エージェントである。ＢＥ１０２は、ＮＬＵフレームワーク１０４に発話１２２を提供し、ＮＬＵエンジン１１６は、以下に論じるＮＬＵフレームワークの様々なサブシステムとともに、意図－実体モデル１０８に基づいて発話１２２を処理し、発話内のアーティファクト（たとえば、意図および／または実体）を導出する。ＮＬＵエンジン１１６によって導出されたアーティファクト、ならびに会話モデル１１０内の関連に基づいて、ＢＥ１０２は、１つまたは複数の特定の事前定義された行動を実行する。図示の実施形態では、ＢＥ１０２はまた、たとえば受け取ったユーザ発話１２２に応答してＢＥ１０２によって実行される行動を示す応答１２４（たとえば、仮想エージェント発話１２４または確認）を、ネットワーク１８を介してクライアントデバイス１４Ｄに提供する。加えて、特定の実施形態では、発話１２２は、ＮＬＵフレームワーク１０４内の継続学習のために、データベース１０６内に記憶された発話１１２に追加することができる。

【0044】

他の実施形態では、エージェント自動化フレームワーク１００および／またはＮＬＵフレームワーク１０４の１つまたは複数の構成要素は、改善された性能のために、他の方法で配置、位置決め、またはホストすることができることが理解されよう。たとえば、特定の実施形態では、ＮＬＵフレームワーク１０４の１つまたは複数の部分は、クライアントインスタンス４２とは別個であるがクライアントインスタンス４２に通信可能に結合されたインスタンス（たとえば、共有インスタンス、企業インスタンス）によってホストすることができる。そのような実施形態は、有利には、クライアントインスタンス４２のサイズを低減させ、それによりクラウドベースのプラットホーム２０の効率を改善することができることが現在認識されている。特に、特定の実施形態では、以下に論じる類似性スコアリングサブシステムの１つまたは複数の構成要素は、探索空間内の好適な整合意味表現のために改善された意味探索を有効にし、発話１２２に対するアーティファクト整合の識別を有効にするように、クライアントインスタンス４２ならびに他のクライアントインスタンスに通信可能に結合された別個のインスタンス（たとえば、企業インスタンス）によってホストすることができる。

【0045】

上記を念頭に、図４Ｂは、エージェント自動化フレームワーク１００の代替実施形態を示し、この実施形態では、ＮＬＵフレームワーク１０４のいくつかの部分が、クラウドベースのプラットホーム２０によってホストされる別個の共有インスタンス（たとえば、企業インスタンス１２５）によって代わりに実行される。図示の企業インスタンス１２５は、好適なプロトコル（たとえば、好適なＲｅｐｒｅｓｅｎｔａｔｉｏｎａｌＳｔａｔｅＴｒａｎｓｆｅｒ（ＲＥＳＴ）要求／応答）を介して、任意の好適な数のクライアントインスタンスと、アーティファクトの採掘および分類に関係するデータを交換するように通信可能に結合される。したがって、図４Ｂに示す設計の場合、複数のクライアントインスタンス４２にアクセス可能な共有資源としてＮＬＵフレームワークの一部分をホストすることによって、クライアントインスタンス４２のサイズを実質的に低減させることができ（たとえば、図４Ａに示すエージェント自動化フレームワーク１００の実施形態と比較）、エージェント自動化フレームワーク１００の全体的な効率を改善することができる。

【0046】

特に、図４Ｂに示すＮＬＵフレームワーク１０４は、ＮＬＵフレームワーク１０４内で別個のプロセスを実行する３つの別個の構成要素に分割される。これらの構成要素は、企業インスタンス１２５によってホストされる共有ＮＬＵ訓練部１２６と、企業インスタンス１２５によってホストされる共有ＮＬＵ注釈部１２７と、クライアントインスタンス４２によってホストされるＮＬＵ予測部１２８とを含む。図４Ａおよび図４Ｂに示す組織は、単なる例であり、本開示によれば、他の実施形態において、ＮＬＵフレームワーク１０４および／またはエージェント自動化フレームワーク１００の他の組織を使用することもできることが理解されよう。

【0047】

図４Ｂに示すエージェント自動化フレームワーク１００の実施形態では、共有ＮＬＵ訓練部１２６は、クライアントインスタンス４２から発話コーパス１１２を受け取り、意味論的採掘（たとえば、意味論的解析、文法工学などを含む）を実行して、意図－実体モデル１０８の生成を容易にするように設計される。意図－実体モデル１０８が生成された後、ＢＥ１０２が、クライアントデバイス１４Ｄによって提供されるユーザ発話１２２を受け取ったとき、ＮＬＵ予測部１２８は、発話１２２の解析および注釈のために、発話１２２および意図－実体モデル１０８を共有ＮＬＵ注釈部１２７に渡す。共有ＮＬＵ注釈部１２７は、意図－実体モデル１０８に基づいて、発話１２２の意味論的解析、文法工学などを実行し、発話１２２の注釈付きの発話木をクライアントインスタンス４２のＮＬＵ予測部１２８へ返す。次いでＮＬＵ予測部１２８は、以下により詳細に論じる発話１２２のこれらの注釈付き構造を使用して、意図－実体モデル１０８から整合する意図を識別し、したがってＢＥ１０２は、識別された意図に基づいて、１つまたは複数の行動を実行することができる。以下に論じるように、共有ＮＬＵ注釈部１２７は、ＮＬＵフレームワーク１０４の意味抽出サブシステム１５０に対応することができ、ＮＬＵ予測部は、意味探索サブシステム１５２に対応することができることが理解されよう。

【0048】

図５は、挙動エンジン（ＢＥ）１０２およびＮＬＵフレームワーク１０４がエージェント自動化フレームワーク１００の一実施形態においてそれぞれの役割を実行するプロセス１４５を示す流れ図である。図示の実施形態では、ＮＬＵフレームワーク１０４は、意図－実体モデル１０８に基づいて、受け取ったユーザ発話１２２を処理し、アーティファクト１４０（たとえば、意図および／または実体）を抽出する。抽出されたアーティファクト１４０は、ＢＥ１０２によって消費可能な形式で、ユーザ発話１２２の意図および実体を表す１群の記号として実施することができる。したがって、これらの抽出されたアーティファクト１４０は、ＢＥ１０２へ提供され、ＢＥ１０２は、会話モデル１１０に基づいて、受け取ったアーティファクト１４０を処理し、受け取ったユーザ発話１２２に応答して、好適な行動１４２（たとえば、パスワードの変更、記録の作成、アイテムの購入、アカウントの閉鎖）および／または仮想エージェント発話１２４を判定する。矢印１４４によって示すように、プロセス１４５は、エージェント自動化フレームワーク１００が会話形式において同じユーザおよび／または他のユーザから追加のユーザ発話１２２を受け取ってそれに対処するとき、連続して繰り返すことができる。

【0049】

図５に示すように、特定の状況では、好適な行動１４２が実行された後、さらなる行動または通信を行うことができないことが理解されよう。加えて、本明細書では、ユーザ発話１２２およびエージェント発話１２４について、書かれた会話媒体またはチャネル（たとえば、チャット、電子メール、チケッティングシステム、テキストメッセージ、フォーラムポスト）を使用して伝達されるものとして論じたが、本開示によれば、他の実施形態において、話されたユーザ発話１２２をテキストに変換し、かつ／またはテキストベースのエージェント発話１２４をスピーチに変換して、音声対話システムを有効にするために、音声－テキストおよび／またはテキスト－音声モジュールまたはプラグインを含むこともできることに留意されたい。さらに、特定の実施形態では、ユーザ発話１２２および仮想エージェント発話１２４はどちらも、エージェント自動化フレームワーク１００における新しい構造および語彙の継続学習を有効にするために、データベース１０６（たとえば、発話コーパス１１２）内に記憶することができる。

【0050】

上述したように、ＮＬＵフレームワーク１０４は、ＮＬＵの難題を管理しやすい探索問題に変換するように協働する２つの１次サブシステム、すなわち意味抽出サブシステムおよび意味探索サブシステムを含む。たとえば、図６は、エージェント自動化フレームワーク１００の一実施形態におけるＮＬＵフレームワーク１０４の意味抽出サブシステム１５０および意味探索サブシステム１５２の役割を示すブロック図である。図示の実施形態では、図６の右側部分１５４は、ＮＬＵフレームワーク１０４の意味抽出サブシステム１５０が意図－実体モデル１０８を受け取るところを示し、意図－実体モデル１０８は、このモデルの様々なアーティファクトの各々に対するサンプル発話１５５を含む。意味抽出サブシステム１５０は、意図－実体モデル１０８のサンプル発話１５５の意味表現１５８（たとえば、発話木構造）を含む理解モデル１５７を生成する。言い換えれば、理解モデル１５７は、以下により詳細に論じるように、意味探索サブシステム１５２による探索（たとえば、比較および整合）を有効にするために意味表現１５８を含む意図－実体モデル１０８の変換または拡大版である。したがって、図６の右側部分１５４は、概して、たとえば定期的に、予定どおりに、または意図－実体モデル１０８の更新に応答して、ユーザ発話１２２を受け取る前に実行されることが理解されよう。

【0051】

図６に示す実施形態では、左側部分１５６は、意味抽出サブシステム１５０がまた、ユーザ発話１２２を受け取って処理し、少なくとも１つの意味表現１６２を有する発話意味モデル１６０を生成するところを示す。以下により詳細に論じるように、これらの意味表現１５８および１６２は、発話の１つの理解の文法構文構造を捕捉する形式を有するデータ構造であり、データ構造の部分木は、発話の一部分の意味論的意味を符号化する部分木ベクトルを含む。したがって、所与の発話に対して、対応する意味表現は、以下により詳細に論じるように、意味探索サブシステム１５２による探索、比較、および整合を有効にする共通の意味表現形式において、構文的意味および意味論的意味の両方を捕捉する。したがって、発話意味モデル１６０の意味表現１６２は、概して、探索鍵のように考えることができ、理解モデル１５７の意味表現１５８は、探索鍵を探すことができる探索空間を定義する。したがって、意味探索サブシステム１５２は、以下に論じるように、理解モデル１５７の意味表現１５８を探索して、発話意味モデル１６０の意味表現１６２に整合する１つまたは複数のアーティファクトを突き止め、それによって抽出されたアーティファクト１４０を生成する。

【0052】

本明細書に開示する意味表現１５８、１６２のうちの１つの一例として、図７は、発話に対して生成された発話木１６６の一例を示す図である。理解されるように、発話木１６６は、ユーザ発話１２２に基づいて、または別法としてサンプル発話１５５のうちの１つに基づいて、意味抽出サブシステム１５０によって生成されるデータ構造である。図７に示す例では、発話木１６６は、「Ｉｗａｎｔｔｏｇｏｔｏｔｈｅｓｔｏｒｅｂｙｔｈｅｍａｌｌｔｏｄａｙｔｏｂｕｙａｂｌｕｅ，ｃｏｌｌａｒｅｄｓｈｉｒｔａｎｄｂｌａｃｋｐａｎｔｓａｎｄａｌｓｏｔｏｒｅｔｕｒｎｓｏｍｅｄｅｆｅｃｔｉｖｅｂａｔｔｅｒｉｅｓ．（私は今日、モールのそばの店に行って、青い襟付きのシャツと黒いズボンを買い、欠陥のある電池を返品したい。）」という例示的な発話に基づいている。図示の発話木１６６は、木構造内に配置されたノードセット２０２（たとえば、ノード２０２Ａ、２０２Ｂ、２０２Ｃ、２０２Ｄ、２０２Ｅ、２０２Ｆ、２０２Ｇ、２０２Ｈ、２０２Ｉ、２０２Ｊ、２０２Ｋ、２０２Ｌ、２０２Ｍ、２０２Ｎ、および２０２Ｐ）を含み、各ノードは、例示的な発話の特定の単語またはフレーズを表す。ノード２０２の各々はまた、発話木１６６の特定の部分木を表すものとして説明することができ、部分木は、１つまたは複数のノード２０２を含むことができることに留意されたい。

【0053】

図７に示す発話木１６６の形式または形状は、意味抽出サブシステム１５０によって判定され、例示的な発話の構文の文法的な意味を表す。より具体的には、意味抽出サブシステム１５０の韻律サブシステムは、発話を意図セグメントに分割し、意味抽出サブシステム１５０の構造サブシステムは、これらの意図セグメントから発話木１６６を構築する。ノード２０２の各々は、語彙サブシステムによって判定されたそれぞれの単語ベクトル（たとえば、トークン）を記憶または参照して、発話の特定の単語またはフレーズの意味論的意味を示す。上述したように、各単語ベクトルは、発話の一部分意味論的意味の数学表現を提供する浮動小数点値の順序付きのｎ次元リスト（たとえば、３００次元リスト）（たとえば、１×ＮまたはＮ×１行列）である。

【0054】

さらに、他の実施形態では、発話木１６６の注釈付きの実施形態を形成するために、ノード２０２の各々は、構造サブシステムによって、ノードによって表される単語またはフレーズに関する追加の情報で注釈を付けることができる。たとえば、ノード２０２の各々は、それぞれのノードのクラス注釈を示すそれぞれのタグ、識別子、シェーディング、またはクロスハッチングを含むことができる。特に、図７に示す例示的な発話木１６６では、特定の部分木またはノード（たとえば、ノード２０２Ａ、２０２Ｂ、２０２Ｃ、および２０２Ｄ）は、構造サブシステムによって、動詞ノードになるように品詞ラベルまたはタグで注釈を付けることができ、特定の部分木またはノード（たとえば、ノード２０２Ｅ、２０２Ｆ、２０２Ｇ、２０２Ｈ、２０２Ｉ、および２０２Ｊ）は、主語または目的語ノードになるように注釈を付けることができ、特定の部分木またはノード（たとえば、ノード２０２Ｋ、２０２Ｌ、２０２Ｍ、２０２Ｎ、および２０２Ｐ）は、修飾語ノード（たとえば、主語修飾語ノード、目的語修飾語ノード、動詞修飾語ノード）になるように注釈を付けることができる。これらのクラス注釈は、次いで、注釈付きの発話木から生成された意味表現を比較するときに、意味探索サブシステム１５２によって使用することができる。したがって、意味表現が生成される発話木１６６は、アーティファクト抽出のための基礎（たとえば、最初の基礎）として働くことが理解されよう。

【0055】

本明細書に認められるように、抽出されたアーティファクト１４０の生成を容易にするために、意味探索サブシステム１５２は、発話意味モデル１６０の意味表現１６２の１つまたは複数、および理解モデル１５７の意味表現１５８の１つまたは複数など、いずれか２つ以上の意味表現間の類似性を判定することができる。たとえば、図８は、探索空間２５０内で動作している意味探索サブシステム１５２の一実施形態を示す情報の流れ図である。前述のように、本実施形態の探索空間２５０は、理解モデル１５７の意味表現１５８が格納されており、理解モデル１５７の意味表現１５８によって定義される。他の実施形態では、ＮＬＵフレームワーク１０４は、各々が特定のコンテキストまたはドメインに適している理解モデルなどの複数の理解モデルによって作成された意味表現１５８の露出に基づいて、探索空間２５０を生成することができる。したがって、ユーザ発話１２２が受け取られ、潜在的アーティファクトにセグメント化され（たとえば、韻律サブシステムによる）、それぞれの意味表現１６２に変換された後（たとえば、意味抽出サブシステム１５０による）、意味探索サブシステム１５２は、ユーザ発話１２２の意味表現１６２と探索空間２５０の意味表現１５８とを比較する。実際には、以下により詳細に論じるように、意味探索サブシステム１５２は、探索空間２５０から任意の好適な整合意味表現１５８を識別して、ＮＬＵフレームワーク１０４が、そこから抽出されたアーティファクト１４０を識別することを有効にすることができる。

【0056】

いくつかの実施形態では、意味探索サブシステム１５２は、１つまたは複数の意味表現１５８を、ユーザ発話１２２の意味表現１６２の各々に対する好適な整合として識別する。たとえば、１つまたは複数のユーザ発話１２２に対応する３つの意味表現１６２を受け取ったことに応答して、特定の実施形態の意味探索サブシステム１５２は、意味表現整合を見出すことができるという条件で、探索空間２５０の１つまたは複数の整合意味表現１５８を戻す。意味探索サブシステム１５２はまた、整合意味表現１５８および／またはそのアーティファクトを、付随する信頼性レベルでスコアリングして、意味表現１５８からの可能性が最も高い抽出されたアーティファクト１４０に対する適当なエージェント応答１２４および／または行動１４２を容易にすることができる。

【0057】

本明細書で認識されるように、意味探索サブシステム１５２は、意味表現１５８の標的剪定および抽出されたアーティファクト１４０の判定を容易にするために、予測的類似性スコアリング体系を利用して、意味表現１５８および１６２間のより正確な類似性スコアを累進的に表現することができる。そのような実施形態では、予測的類似性スコアリング体系は、複数のまたは広範な理解モデル１５７の意味表現１５８に基づいて生成されたものなどの探索空間２５０の大きいスケールの出現に対して探索の実行を有効にする。概して、意味探索サブシステム１５２の類似性スコアリングサブシステムは、特定の発話ベースの意味表現１６２と、探索空間２５０内の各意味表現１５８（たとえば、探索空間意味表現）との間の比較を有効にする数学的比較関数リストをまず識別することによって動作する。意味表現１６２に対して比較可能な形式を有していない意味表現１５８の場合、類似性スコアリングサブシステムは、意味表現１５８を不適合と識別し、探索空間２５０から剪定することができる。次いで、類似性スコアリングサブシステムは、特定の意味表現１６２と探索空間２５０の残りの比較可能な意味表現１５８との間の初期類似性スコアを生成するために、最も広範なまたは最も高価でない関数を適用することによって、それぞれの数学的比較関数リストを実施する。以下に論じるように、意味探索サブシステム１５２は、特定の意味表現１６２に好適に類似していない意味表現１５８が探索空間２５０から剪定されているため、より計算的に高価な関数（たとえば、追加のノードを考慮する関数、同じ数のノードの追加の次元を考慮する関数、辞書または外部言語モデルなどのデータベースに問い合わせる関数）を利用するように進むことができる。したがって、意味探索サブシステム１５２は、抽出されたアーティファクト１４０を提供する好適な意味表現１５８を系統的に絞り込む。

【0058】

例として、図９は、ＮＬＵフレームワーク１０４の意味探索サブシステム１５２内で実施することができる類似性スコアリングサブシステム２６０の一実施形態を示す情報の流れ図である。以下に論じるように、類似性スコアリングサブシステム２６０は、数学的比較関数を検索および利用し、より高価な関数を介して任意の好適な数の意味表現を互いに反復して比較する。一例として、図９の本実施形態は、第１の意味表現２６２および第２の意味表現２６４が探索空間２５０の意味表現１５８と比較される類似性スコアリングサブシステム２６０の機能を対象とするが、以下に論じる技法は、ＮＬＵフレームワーク１０４の各意味表現に適用可能であることを理解されたい。理解されるように、第１の意味表現２６２は、上記で論じた意味表現１６２のうちの第１の意味表現１６２に対応することができ、第２の意味表現１６４は、意味表現１６２のうちの第２の意味表現１６２に対応することができる。意味表現２６２、２６４は各々、本明細書ではユーザ発話１２２に対応するものとして主に論じた発話２６６から導出することができるが、他の実施形態では、上記で論じたサンプル発話１５５のうちの１つに対応することもできる。

【0059】

概して、各意味表現２６２、２６４は、意味表現２６２、２６４の形状（たとえば、発話木構造および品詞タギング）に基づいて割り当てられた０、１つ、または複数の認知構造文法（ＣＣＧ）形式クラスに属する。言い換えれば、ＣＣＧ技法に基づいて、類似性スコアリングサブシステム２６０は、各意味表現２６２、２６４が、集合的にＣＣＧ形式にマッピング可能なノード（たとえば、単語ベクトルおよび／または単語ベクトルの組合せ）に対する品詞タグを含む形状または構造（たとえば、発話木または他の好適なメタ構造によって定義される）を有すると認識する。したがって、類似性スコアリングサブシステム２６０は、意味表現２６２、２６４の形状に基づいて探索を実行し、意味表現２６２、２６４に対するアーティファクト整合を含む好適な整合意味表現１５８を識別することができる。

【0060】

図示の実施形態では、類似性スコアリングサブシステム２６０は形式クラスデータベース２７０を含み、形式クラスデータベース２７０内には形式クラステーブル２７２が含まれる。テーブルとして主に論じるが、他の実施形態では、形式クラステーブル２７２を任意の好適なデータ構造で実施することができる。いくつかの実施形態では、形式クラスデータベース２７０および形式クラステーブル２７２は、エージェント自動化フレームワーク１００のデータベース１０６内に記憶することができる。本明細書で認識されるように、形式クラステーブル２７２の各エントリ２７５（たとえば、形式クラスエントリ）は、意味探索サブシステム１５２が対応する１対１の形式クラス比較（ＣＣＧ形式クラス比較とも呼ぶ）を記述する。特に、形式クラステーブル２７２は、第１の意味表現のＣＣＧ形式に関連付けられた第１の軸２７３と、第２の意味表現のＣＣＧ形式に関連付けられた第２の軸２７４とを含み、これらが比較されている。各軸のラベルは、動詞誘導フレーズ、名詞誘導フレーズなど、類似性スコアリングサブシステム２６０が対応するそれぞれのＣＣＧ形式の各々に対する形式パターンに関連付けられており、対応されるｆ_１～ｆ_ＮのＣＣＧ形式範囲内で好適な関数名によって表される。したがって、特定の意味表現に対する形式パターンは、特定の意味表現に対するＣＣＧ形式クラスのメンバーシップを定義することを理解されたい。

【0061】

本実施形態では、形式クラステーブル２７２は、２つの関連付けられたＣＣＧ形式が比較可能であるかどうかを示すために、ＣＣＧ形式のうちの２つの各交差に対して、エントリ２７５のうちのそれぞれのエントリ２７５を含み、比較可能である場合、比較の性能に関する命令を含む。形式クラステーブル２７２は、比較されたＣＣＧ形式クラスの可能な各順列に対応する任意の好適な数のエントリ２７５を含むことができることを理解されたい。特に、各々が同じＣＣＧ形式クラスに属する意味表現は、それ自体が互いに比較可能であり、形式クラステーブル２７２の中心対角線２７６に沿って各エントリ２７５内に示されている以下に論じる比較関数リストによって表される。本明細書に示すように、形式クラステーブル２７２は、中心対角線２７６に沿って鏡映対称線を有し、形式クラステーブル２７２の本実施形態の比較関数が可換であることを示す。すなわち、第１の意味表現を第２の意味表現と比較することは、第２の意味表現を第１の意味表現と比較することと同じ結果をもたらす。他の実施形態では、形式クラステーブル２７２は、鏡映対称線を含まなくてもよく、したがって類似性スコアリングサブシステム２６０が、意味表現が比較されている順序または方向に基づいて、以下に論じる比較関数リストを適合させることが有効になる。特定の例として、形式クラステーブル２７２の１つのエントリ２７５は、動詞誘導ＣＣＧ形式を有する意味表現を、動詞誘導ＣＣＧ形式、名詞誘導ＣＣＧ形式などを有する他の意味表現と比較することができると指定することができる。本実施形態では、類似性スコアリングサブシステム２６０は、比較のためのエントリ２７５が空（たとえば、ナル、未定義）であると判定したことに応答して、１対の意味表現が比較可能でないと判定し、したがって比較可能でない意味表現間の比較を実行しない。

【0062】

上述したように、類似性スコアリングサブシステム２６０の対応される各ＣＣＧ形式クラス比較に対する形式クラステーブル２７２のエントリ２７５はまた、１つまたは複数の関数２８０（たとえば、比較関数）を有する数学的比較関数リスト２７８（たとえば、形式代数関数リスト、処理規則）を含み、または、類似性スコアリングサブシステム２６０を数学的比較関数リスト２７８に向ける。各数学的比較関数リスト２７８の関数２８０は、以下により詳細に説明するように、意味表現２６２、２６４の各々を探索空間２５０と比較することを有効にする累進的により高価なスコアリング関数を提供する入れ子状の関数セットである。数学的比較関数リスト２７８は、類似性スコアリングサブシステム２６０が任意の好適な数の意味表現間の類似性スコアを判定するために用いることができるベクトル代数、コサイン類似性関数、外部データベースへのクエリ、および／または任意の他の好適な数学関数もしくは数式を含むことができる。関数２８０は、数学的比較関数リスト２７８の前の機能をさらに定義することができ、または別法として前の関数２８０から完全に独立したものとすることもできることを理解されたい。いくつかの実施形態では、形式クラステーブル２７２の各エントリ２７５に対する数学的比較関数リスト２７８は、言語学者またはユーザによって手動で指定されたもの、ＭＬ技法によって導出されたものなどである。

【0063】

概して、数学的比較関数リスト２７８の関数２８０は各々、意味表現２６２、２６４の考慮された部分が探索空間２５０の意味表現１５８に好適に整合することに応答して、特定の閾値スコアを上回る類似性スコアを与えることによって、意味表現２６２、２６４のうちの比較可能な意味表現と探索空間２５０との間の類似性をそれぞれスコアリングする。特定の実施形態では、関数２８０は、それぞれの意味表現１５８が、対応する探索鍵意味表現２６２、２６４の重要または顕著なノードを除外したこと、またはそのようなノードに整合しないことに応答して、探索空間２５０のそれぞれの意味表現１５８に関連付けられた類似性スコアに０を割り当てることができ、または他の方法でペナルティを与えることができる。理解されるように、類似性スコアリングサブシステム２６０は、空の形式クラステーブル２７２のエントリ２７５によって示されるように、形式クラスデータベース２７０の形式クラス互換性規則に基づいて、比較に好適でないＣＣＧ形式を有する別の意味表現と、意味表現を比較しない。

【0064】

他の実施形態では、類似性スコアリングサブシステムは、いくつかの実施形態において、比較可能でない対の意味表現に、０の類似性スコアをすぐに割り当てることができる。さらなる実施形態では、類似性スコアリングサブシステム２６０は、類似性スコアリングサブシステム２６０に、比較可能でない意味表現間の０の類似性スコアを生成させる関数２８０を有する数学的比較関数リスト２７８を実施することによって、比較を実行することができる。そのような実施形態では、数学的比較関数リスト２７８は自然に、類似性スコアリングサブシステム２６０に、意味表現２６２、２６４との比較に好適でないＣＣＧ形式を有する意味表現１５８に０またはナルの類似性スコアを割り当てさせることができるため、形式クラステーブル２７２は、形式クラステーブル２７２の各エントリ２７５内に適当な数学的比較関数リスト２７８を含むことができる。

【0065】

さらに、特定の実施形態では、類似性スコアリングサブシステム２６０は、発話意味モデル１６０から発話２６６の複数の感情表現の表現を受け取ることができる。たとえば、意味表現２６２、２６４は、発話２６６に対する代替形式を表すものとして、発話意味モデル１６０内に含むことができる。概して、意味表現２６２、２６４（意味抽出サブシステム１５０によって作成され、発話意味モデル１６０内に含まれる）の各々は、発話２６６のアーティファクトに対応する好適に別個の意味表現を表す。比較可能な各対の意味表現２６２、２６４を考慮することによって、本実施形態の類似性スコアリングサブシステム２６０は、対応する抽出されたアーティファクト１４０に対してより徹底的な探索を提供するために、またはそのようなアーティファクト１４０に対してより大きい網をかけるために、発話２６６の複数の解釈を評価することができる。

【0066】

特有の例について論じるために図６を簡単に参照すると、特定の実施形態の意味抽出サブシステム１５０は、「Ｂｏｏｋｍｅｅｔｉｎｇ（会議を予約して）」という発話２６６が、「ｒｅｑｕｅｓｔｂｏｏｋｉｎｇｏｒｓｃｈｅｄｕｌｉｎｇａｍｅｅｔｉｎｇ（会議の予約か予定を要求して）」に対応する第１の代替意味表現と、「ａｍｅｅｔｉｎｇａｂｏｕｔａｂｏｏｋ（本に関する会議）」に対応する第２の代替意味表現とを有すると判定することができる。意味抽出サブシステム１５０は、次いで、これらの代替意味表現を発話意味モデル１６０内に組み込むことができる。意味探索サブシステム１５２を介してこれらの代替意味表現の両方を類似性スコアリングプロセスの後のステップへ伝えることによって、類似性スコアリングサブシステム２６０は、好適な抽出されたアーティファクト１４０の識別を有効にする好適な数学的比較関数リスト２７８を識別する可能性がより高くなる。

【0067】

類似性スコアリングサブシステム２６０の構成要素の上記の説明を念頭に、図１０は、プロセス３００の一実施形態を示す流れ図であり、プロセス３００によって、類似性スコアリングサブシステム２６０は、図９の第１の意味表現２６２と図８の探索空間２５０の意味表現１５８との間の比較を有効にする数学的比較関数リスト２７８のうちの１つを検索する。プロセス３００は、意味探索サブシステム１５２の類似性スコアリングサブシステム２６０によって考慮される発話ベースの各意味表現１６２に対して、繰り返すことができ、または並行して別個に処理することができることを理解されたい。上記で論じたように、類似性スコアリングサブシステム２６０を含む意味探索サブシステム１５２は、意味抽出サブシステム１５０によって定義された発話２６６に対する意味表現２６２を発話意味モデル１６０から受け取ることができる。他の実施形態では、類似性スコアリングサブシステム２６０は、意味表現２６２を意味抽出サブシステム１５０から直接検索することができる。意味抽出サブシステム１５０の一部として図示および／または説明するステップは、好適なメモリ（たとえば、メモリ８６）内に記憶することができ、クライアントインスタンス４２（たとえば、データセンタ２２内）または企業インスタンス１２５（たとえば、クラウドベースのプラットホーム２０によってホストされる）に関連付けられた好適なプロセッサ（たとえば、プロセッサ８２）によって実行することができる。

【0068】

したがって、プロセス３００の図示の実施形態を開始する類似性スコアリングサブシステム２６０は、意味表現２６２のＣＣＧ形式３０４（たとえば、認知構文文法形式）を判定する（ブロック３０２）。上述したように、ＣＣＧ形式３０４は、ノード内のトークン（たとえば、単語またはフレーズ）の品詞の注釈またはタギングに関して分析される意味表現２６２のノードによって形成される形状の任意の好適な説明とすることができる。たとえば、類似性スコアリングサブシステム２６０は、意味表現２６２が、動詞－代名詞－名詞フレーズ、名詞－動詞－直接目的語フレーズ、名詞－動詞－副詞フレーズなどに対応するＣＣＧ形式３０４を有することを識別することができる。

【0069】

本実施形態では、類似性スコアリングサブシステム２６０は、処理規則セット３０６（たとえば、形式処理規則）を適用し、処理規則セット３０６に対する対応関係に基づいてＣＣＧ形式３０４を意味表現２６２に割り当てることによって、意味表現２６２に対するＣＣＧ形式３０４を判定する。他の実施形態では、類似性スコアリングサブシステム２６０は、意味抽出サブシステム１５０からＣＣＧ形式３０４を受け取ること、またはＭＬベースのパターン整合技法など、任意の他の好適な方法によって、ＣＣＧ形式３０４を判定することができる。ＭＬベースのパターン整合の一例として、類似性スコアリングサブシステム２６０は、意味表現２６２の品詞タグを有する形状と理解モデル１５７の意味表現１５８とを比較して、これらの間の類似性を識別することによって、意味表現２６２に対して好適なまたは最も密接に整合するＣＣＧ形式３０４を判定することができる。理解されるように、類似性スコアリングサブシステム２６０は、意味表現２６２のＣＣＧ形式３０４の判定を有効にする任意の好適なプラグインまたは他の処理構成要素を含むことができる。

【0070】

意味表現２６２に対するＣＣＧ形式３０４が識別された状態で、類似性スコアリングサブシステム２６０は、次いで、形式クラスデータベース２７０から、ＣＣＧ形式３０４に対する０、１、または複数の整合形式クラス３１２を判定する（ブロック３１０）。整合形式クラス３１２は、パターン整合、形式クラスデータベース２７０のテーブル式実施形態への問合せなどによって識別することができる。より詳細には、本実施形態の類似性スコアリングサブシステム２６０は、数学的比較関数リスト２７８を有する形式クラステーブル２７２内に対応するエントリ２７５を突き止め、それによってどの形式クラスと意味表現２６２を比較することができるかを判定する。実際には、上述したように、特定のＣＣＧ形式３０４に対する形式クラステーブル２７２の各エントリ２７５は、意味表現２６２のＣＣＧ形式３０４と比較することができる各ＣＣＧ形式に対する数学的比較関数リスト２７８（たとえば、形式クラス互換性）、ならびに類似性を計算することができる関数セット２８０のうちの１つを含むことができる。

【0071】

したがって、プロセス３００をたどる類似性スコアリングサブシステム２６０は、形式クラステーブル２７２の各エントリ２７５から、意味表現２６２のＣＣＧ形式３０４と、それぞれのエントリ２７５に関連付けられた他の意味表現のＣＣＧ形式（たとえば、各整合形式クラス３１２）との間の識別された整合を示すそれぞれの数学的比較関数リスト２７８を検索する（ブロック３１４）。本実施形態では、類似性スコアリングサブシステム２６０は、１つの整合形式クラス３１２を識別し、１つの数学的比較関数リスト２７８を出力するが、形式クラス整合の数に応じて、任意の他の好適な数の数学的比較関数リスト２７８を検索することができることを理解されたい。たとえば、類似性スコアリングサブシステム２６０は、意味表現２６２と同じＣＣＧ形式３０４を有する意味表現とをどのように比較するかを指示する第１の数学的比較関数リスト２７８、ならびに意味表現２６２と異なるＣＣＧ形式３０４を有する別の意味表現との間の比較を有効にする第２の数学的比較関数リスト２７８を検索することができる。

【0072】

数学的比較関数リスト２７８の使用を示すために、図１１は、意味探索サブシステム１５２の類似性スコアリングサブシステム２６０が、１つの数学的比較関数リスト２７８を利用して、意味表現２６２と探索空間意味表現３３０（たとえば、探索空間２５０の）とを比較する、一実施形態の図である。本実施形態では、探索空間意味表現３３０は、探索空間２５０の意味表現１５８のうちの１つであるが、本技法は、任意の好適な意味表現を比較するために利用することができることを理解されたい。前述のように、数学的比較関数リスト２７８は、順序付きの関数セット２８０を含み、そのような関数セット２８０は、数学的比較関数リスト２７８内により深く位置決めされた関数２８０内の比較される意味表現２６２、３３０から、さらなる計算資源および／またはデータ（たとえば、より多数のノード）を累進的に利用する。本明細書で認識されるように、数学的比較関数リスト２７８は、計算的にそれほど高価でない関数２８０が最初にくるように順序付けられており、探索空間２５０内に含まれる潜在的意味表現１５８が剪定されるにつれて、より高価な関数を活用するように進む。したがって、類似性スコアリングサブシステム２６０は、概して、後に利用されるより高価な関数２８０を介して、より正確な類似性スコア３４０（たとえば、予測的類似性スコア）を判定する。

【0073】

たとえば、第１の比較３５０中、類似性スコアリングサブシステム２６０は、第１の関数３５２を実施して、意味表現２６２の根ノード３５４と探索空間意味表現３３０の探索空間根ノード３５６とを比較することができる。前述のように、第１の関数３５２は、数学的比較関数リスト２７８の最も高価でない関数２８０である。類似性スコアリングサブシステム２６０は、次いで、意味表現２６２、３３０間の話題の（たとえば、深さが小さく、計算するのに最も安価な）類似性を記述する第１の類似性スコア３６０を判定することができる。第１の関数３５２が数学的比較関数リスト２７８の最も高価でない関数３５２であることを考慮して、根ノード３５４、３５６は、意味表現２６２、３３０のうち、第１の関数３５２を介して比較される部分の例であり、各意味表現２６２、３３０の全体を含む他の部分は、第１の比較３５０において比較することができることを理解されたい。類似性スコア３４０は、０～１、０～５、０～１０などの類似性スコアリング範囲が割り当てられた値など、２つの意味表現に対する品詞タグを含む形式間の類似性または対応関係の任意の好適な数学表現とすることができる。少なくとも類似性スコア３４０は、２つの意味表現の考慮部分間の包括的な意味および形式ベースの類似性について記述することから、本明細書に記載する類似性スコア３４０は、２つの意図ベクトル間で判定される上記で論じた類似性測度とは別個であることを理解されたい。

【0074】

図１１の本実施形態では、第１の比較３５０中に評価される根ノード３５４、３５６が、中空の円として示されている。中実の円によって示すように、意味表現２６２、３３０の残りの従属ノードは、第１の比較３５０中に事実上「被覆」されている（たとえば、考慮されない）。この方法論を以下に論じる後の比較まで拡大すると、それぞれの比較において中空の円として示すノードは、それぞれの比較において評価され（たとえば、考慮ノード３６２）、中実の円として示すノードは評価されない（考慮されないノード３６４）。

【0075】

概して、類似性スコアリングサブシステム２６０は、最も高価でないものから最も高価なものへの関数２８０の順序を活用して、数学的比較関数リスト２７８内で後に位置決めされたより広範かつ計算的に高価な比較を探索空間２５０の集中部分で実行することを有効にする。いくつかの実施形態では、類似性スコアリングサブシステム２６０は、類似性スコアリングサブシステム２６０が後の比較を進むにつれて、意味表現２６２、３３０のより多くのノードを選択的に「露出」（たとえば、考慮）することができる。

【0076】

たとえば、第１の類似性スコア３６０を判定した後、本実施形態の類似性スコアリングサブシステム２６０は、増大された数の考慮ノード３６２に基づいてより正確な第２の類似性スコア３７２を生成する第２の関数３６８を第２の比較３７０内で実施するように進む。次いで、類似性スコアリングサブシステム２６０は、考慮ノード３６２に関連付けられた単語ベクトルのより多数の次元を考慮すること、外部データベースを調べること、または任意の他の好適な関数もしくは動作によって、同じ数のノードを考慮するがより高価な第３の関数３７８を介してさらに正確な第３の類似性スコア３７６を生成する第３の比較３７４を実行する。類似性スコアリングサブシステム２６０は、後に、第４の関数３８４を介して最も正確な最終類似性スコア３８２を生成する最終比較３８０を実行し、第４の関数３８４は、概して、利用される最も高価な関数２８０とすることができる。意味表現２６２、３３０間の図示の比較３５０、３７０、３７４、３８０に関するさらなる詳細は、以下に提供される。

【0077】

さらに、図示されていないが、類似性スコアリングサブシステム２６０は、類似性スコアに対する様々な品詞の寄与をコンテキスト依存で調整するように、比較内で重みまたは係数（たとえば、ＭＬ技法から導出される）を実施することができることを理解されたい。たとえば、探索エンジン要求を処理するために、類似性スコアリングサブシステム２６０は、名詞または動詞に対する修飾語の寄与を増大させることができる。別法として、ＮＬＵフレームワーク１０４のチャットボットの実施形態へ提供される購入注文要求中、類似性スコアリングサブシステム２６０は、修飾語または動詞に対する名詞の寄与を増大させることができる。いくつかの実施形態では、類似性スコアリングサブシステム２６０は、動作中にＮＬＵフレームワーク１０４内の意味表現１５８から重みを学習し、したがって時間とともにより談話特有になることができる。

【0078】

本明細書で認識されるように、特定の実施形態の類似性スコアリングサブシステム２６０はまた、意味表現の部分木ベクトルの好適な組合せを比較することによって、異なるサイズを有する２つの意味表現間の類似性を分析することができる。たとえば、類似性スコアリングサブシステム２６０は、より短い意味表現内に比較可能な同等物を有していないより長い意味表現のノードの部分木ベクトルに対する組合せ（たとえば、質量中心または加重平均）を判定することができる。したがって、本技法によれば、これらの実施形態の類似性スコアリングサブシステム２６０は、より短い意味表現に対して修正された意味表現（比較可能でないノードの代わりに比較を含む）を分析することができる。

【0079】

特定の実施形態では、類似性スコアリングサブシステム２６０は、意味表現２６２、３３０の特定の内容、類似性スコアリングサブシステム２６０が動作している特定のコンテキスト、類似性スコアリングプロセスの所望の粒度などに基づいて、考慮ノードの部分を一方、他方、または両方の意味表現２６２、３３０に対して拡大するように、関数２８０の特定の依存しない実施形態を適用することができる。たとえば、特に徹底的な類似性スコアリングプロセスが所望される場合、類似性スコアリングサブシステム２６０は、探索空間意味表現３３０に対する考慮ノード３６２の数はそのままにしながら、意味表現２６２の考慮ノード３６２の数を拡大することができる。次の比較中、類似性スコアリングサブシステム２６０は、考慮ノード３６２の各順列を評価するために、意味表現２６２の考慮ノード３６２を縮小し、探索空間意味表現３３０の考慮ノード３６２を拡大することができる。急速な類似性スコアリングプロセスが実行される他の実施形態では、類似性スコアリングサブシステム２６０は、別法として、各比較に対して両方の意味表現２６２、３３０の考慮ノード３６２を拡大することができる。さらに、意味表現２６２、３３０が、同一の形式および長さを有するものとして示されているが、類似性スコアリングサブシステム２６０は、同一でない形式および／または長さを有する任意の好適な意味表現を反復して比較することができることを理解されたい。

【0080】

さらに、いくつかの状況では、発話２６６の意味表現２６２は、広範な名詞誘導ＣＣＧ形式およびより具体的なＣＣＧ形式（たとえば、名詞－形容詞－動詞）の両方など、複数のＣＣＧ形式３０４に対応することも認識されよう。したがって、特定の実施形態の類似性スコアリングサブシステム２６０は、意味表現２６２が適した形式クラスデータベース２７０によって対応される複数の形式クラスを識別することができる。そのような実施形態では、類似性スコアリングサブシステム２６０は、有利には、意味表現２６２を記述する各ＣＣＧ形式３０４に対して類似性スコアを生成することができる。次いで、類似性スコアリングサブシステム２６０は、意味探索の範囲を増大させることによって、意味表現２６２の割り当てられた各ＣＣＧ形式に対する類似性スコアを集約し、エージェント自動化システム１００の動作を改善することができる。

【0081】

いずれの場合も、類似性スコアリングサブシステム２６０は、意味表現の各ＣＣＧ形式に対する類似性スコアに照合関数を適用し、したがって意味表現２６２の複数のＣＣＧ形式３０４の解釈によって実行された比較からのそれぞれの類似性スコアリング結果を照合（たとえば、統合）することができる。特定の実施形態では、照合関数は、形式クラスデータベース２７０内に記憶することができる。本明細書で認識されるように、照合関数は、類似性スコアの最大または加重平均を保持することなどによって、類似性スコアリングサブシステム２６０が、意味表現２６２のＣＣＧ形式３０４の単一の解釈に由来する制限を超える総精練類似性スコア（たとえば、総類似性スコア）を生成および出力することを有効にする。さらに、特定の実施形態の照合関数は、ＣＣＧ形式３０４の各組合せ、各クライアント、類似性スコアリングサブシステム２６０が動作する各ドメインなどに対して、個々に適合させることができる。

【0082】

図１２は、プロセス４００の一実施形態を示す流れ図であり、プロセス４００によって、類似性スコアリングサブシステム２６０は、数学的比較関数リスト２７８を利用して、探索空間２５０から整合意味表現を反復して識別することができる。前述のように、探索空間２５０は、少なくとも１つの理解モデル１５７の意味表現１６２によって定義される。理解されるように、プロセス４００は、類似性スコアリングサブシステム２６０が、発話意味モデル１６０の各意味表現１６２（上記で導入された意味表現２６２に対応する）と、探索空間２５０内の膨大な数の意味表現１５８との間の類似性を予測的に評価することが有効になる。プロセス４００は、図３、図４Ａ、および図４Ｂに関して上記で論じたように、好適なメモリ（たとえば、メモリ８６）内に記憶することができ、クライアントインスタンス４２または企業インスタンス１２５に関連付けられた好適なプロセッサ（たとえば、プロセッサ８２）によって実行することができる。

【0083】

詳細には、図示の実施形態の類似性スコアリングサブシステム２６０は、ｆｏｒ－ｅａｃｈループによって、発話意味モデル１６０の各意味表現２６２に対して反復される（ブロック４０２）。類似性スコアリングサブシステム２６０は、ｆｏｒ－ｅａｃｈループの代わりに、各ＣＣＧ形式３０４に対して精練された類似性スコア４１４の生成を有効にする任意の他の好適な処理体系を実施することができることを理解されたい。たとえば、類似性スコアリングサブシステム２６０は、別法として、ｄｏ－ｗｈｉｌｅループ、ｆｏｒループ、ｗｈｉｌｅループ、ｄｏ－ｕｎｔｉｌループなどを実施することができる。いずれにせよ、発話意味モデル１６０の各意味表現２６２に対して、類似性スコアリングサブシステムは、それぞれの意味表現２６２のＣＣＧ形式を判定し（ブロック４０４）、形式クラスデータベース２７０から関連付けられた数学的比較関数リスト２７８を検索する。ＣＣＧ形式に基づいてプロセス４００に対する反復パラメータを初期化することで、類似性スコアリングサブシステム２６０はまた、数学的比較関数リスト２７８の第１の関数２８０を選択し（ブロック４０６）、最初に全探索空間２５０になるように、関心探索部分空間を定義する。

【0084】

プロセス４００の図示の実施形態では、ユーザ発話１２２から導出された意味表現２６２と、探索部分空間の比較可能な意味表現１５８とを比較し（ブロック４１０）、それによって意味表現２６２と探索部分空間の比較可能な意味表現との比較に対応する類似性スコアセット４１２を生成する。いくつかの実施形態では、類似性スコアリングサブシステム２６０は、比較された意味表現の意味ベクトル（たとえば、部分木ベクトル）間の距離に基づいて、類似性スコアセット４１２を判定することができる。上述したように、類似性スコアリングサブシステム２６０は、最小量の計算資源を利用する第１の関数３５２を実施する。したがって、類似性スコアリングサブシステム２６０は、単一の複雑さの比較関数を利用してユーザ発話の意味表現と探索空間または理解モデル内の各意味表現とを系統的に比較することができる他の探索システムより、この初期ＣＣＧ形式探索および類似性スコアリングを急速かつ／または効率的に実行することができる。

【0085】

たとえば、図１３を次に参照すると、図１３は、数学的比較関数リスト２７８を適用して探索空間２５０を好適な探索部分空間５０２に選択的に精練する類似性スコアリングサブシステム２６０の一実施形態の概略図を示す。たとえば、第１の比較５００中、類似性スコアリングサブシステム２６０は、第１の関数３５２を適用して、意味表現２６２と、探索空間２５０の全体になるように初期化された探索部分空間５０２内の比較可能な意味表現１５８とを比較することができる。本明細書で認識されるように、最も正確でないが最も効率的な関数３５２をこうして適用することで、類似性スコアリングサブシステム２６０が探索部分空間５０２において第１回の探索を効率的に実行することが有効になる。本実施形態では、第１の関数３５２は、意味表現２６２の根ノード３５４を考慮するが、第１の関数３５２を介して、意味表現２６２の別の好適な部分（たとえば、他のノードまたはノードの組合せ）を分析することもできることを理解されたい。

【0086】

図１２に戻ると、類似性スコアリングサブシステム２６０は、探索部分空間５０２から意味表現１５８を除去または剪定し（ブロック４１４）、剪定された意味表現１５８は、セット４１２のうち、閾値類似性スコア（たとえば、所定の閾値スコア）を下回る類似性スコアを有する。特定の実施形態では、閾値類似性スコアは、類似性スコアリングサブシステム２６０内にパラメータとして記憶された可能な類似性スコアの範囲内の事前定義された値である。したがって、類似性スコアリングサブシステム２６０は、後の関数２８０の効率的な適用のために、探索部分空間５０２を、低減された数の探索部分空間５０２の意味表現１５８に縮小することができる。実際には、図１４に戻ると、探索部分空間５０２は、第１の比較５００後、セット４１２のうち閾値を下回る類似性スコアに関連付けられた意味表現１５８を探索部分空間５０２から除去するように狭められる（たとえば、収縮される、刈り込まれる）。

【0087】

いくつかの実施形態では、類似性スコアリングサブシステム２６０は、ユーザ定義値を閾値類似性スコアとして受け取り、それを下回ると探索部分空間５０２の意味表現１５８が無視される閾値を較正する。類似性スコアリングサブシステム２６０はまた、ＭＬ技法、類似性スコアリングサブシステム２６０が現在動作している特有のコンテキストなどに基づいて、閾値類似性スコアを更新することができる。たとえば、類似性スコアリングサブシステム２６０は、特定の探索部分空間５０２が非常に大きいコンテキストのために、かつ／または予測的類似性スコアリングプロセスをさらに速めるために、比較的高いまたは選択的な閾値類似性スコア（たとえば、少なくとも９０％の整合）を実施することができる。さらに、閾値類似性スコアは、各関数２８０が適用された後、個々に選択または更新することができる。より詳細には、本明細書に開示する類似性スコアリングサブシステム２６０は、前の比較において、閾値を上回る数の意味表現１５８が閾値類似性スコアを満たしたと判定したことに応答して、後の比較に対する閾値類似性スコアの値または選択性を減少させることができる。

【0088】

図１２のプロセス４００に戻ると、類似性スコアリングサブシステム２６０は、ブロック４１０によって記載されるＣＣＧ形式探索を継続するべきかどうかを判定する（ブロック４１６）。本明細書で認識されるように、類似性スコアリングサブシステム２６０は、１つまたは複数の好適な停止条件が満たされたことに基づいて、ＣＣＧ形式の探索を継続すると判定することができる。たとえば、類似性スコアリングサブシステム２６０は、各意味表現が探索部分空間５０２から剪定されたこと（たとえば、整合がないことを示す）、閾値数の意味表現が探索部分空間内に残っていること（たとえば、可能性が最も高い整合を示す）、最近適用された関数２８０が、関数２８０内の埋込み停止条件が満たされたことを示すこと、数学的比較関数リスト２７８のすべての関数２８０が適用されたことなどに応答して、ＣＣＧ形式の探索を終了することができる。

【0089】

ブロック４１６で、ＣＣＧ形式の探索を継続するべきであると判定したことに応答して、類似性スコアリングサブシステム２６０は、数学的比較関数リスト２７８の次の関数２８０を選択する（ブロック４２０）。次いで、矢印４２２によって示すように、類似性スコアリングサブシステム２６０は、ブロック４１０へ戻り、意味表現２６２と、探索部分空間５０２の残りの比較可能な意味表現１５８とを比較する。したがって、類似性スコアリングサブシステム２６０は、数学的比較関数リスト２７８のより高価な関数２８０を利用することによって、探索部分空間５０２の残りの比較可能な意味表現に関連付けられた類似性スコアセット４１２を精練（たとえば、修正、更新）する。各比較後、類似性スコアリングサブシステム２６０は、プロセス４００を介して生成された様々な類似性スコアセット４１２のアレイを記憶することができ、または別法として、セット４１２の前に生成された各類似性スコアをより正確な同等物に交換することができる。実際には、後の関数２８０の適用中にさらなる処理資源が利用されるため、類似性スコアセット４１２は概して、さらなる関数２８０が適用されると、正確さおよび／または精度に関して改善される。類似性スコアセット４１２に基づいて、図示のプロセス４００を実行する類似性スコアリングサブシステム２６０は、セット４１２のうち、閾値類似性スコアを下回るそれぞれの類似性スコアに関連付けられた意味表現１５８の探索空間２５０を剪定する（ブロック４０４）。

【0090】

図１３を再び参照すると、類似性スコアセット４１２を精練し、探索部分空間５０２を剪定するために、類似性スコアリングサブシステム２６０は、第２の関数３６８を適用して、意味表現２６２と、サイズが低減された探索部分空間５０２内の残りの意味表現１５８とを比較する。したがって、類似性スコアリングサブシステム２６０は、閾値類似性スコアを満たす好適な候補まで探索部分空間５０２をさらに縮小することができる。特定の実施形態では、関数１８０の構造は、本質的に数学的比較関数リスト２７８の関数２８０内の条項などに基づいて、比較された意味表現のそれぞれのノードの露出または拡大を案内する。たとえば、第１の関数３５２は、意味表現の根ノード３５４と探索部分空間５０２の意味表現１５８とを比較する単一の用語を含むことができ、第２の関数３６８は、意味表現２６２の拡大部分と意味表現１５８とを比較する１つまたは複数の条項を含むことができる。

【0091】

したがって、類似性スコアリングサブシステム２６０は、所与の比較のために、累進的により正確かつ高コストになる関数２８０を、探索部分空間５０２の残存している（たとえば、ビーム内の）意味表現１５８に反復して適用する。図１２のプロセス４００の議論を図１３に対して継続すると、類似性スコアリングサブシステム２６０は、第３の比較５１６中に第３の関数３７８を実施して、意味表現２６２の同じ露出部分５１０と、探索部分空間５０２のさらに剪定された実施形態とを比較することができ、以下同様である。したがって、本実施形態の類似性スコアリングサブシステム２６０は、最終比較５２４中に最終関数３８４を実施して、意味表現２６２の全体５２６と、探索部分空間５０２の最終実施形態とを比較するように設計され、著しく低減された数の残りの意味表現１５８の候補のために、最も計算集約的な最終関数３８４の使用を節約する。実際には、特定の事例では、図１３の最終比較５２４は、意味表現２６２内の利用可能な情報の全体を活用して、探索空間２５０から、意味表現２６２に好適に整合する意味表現セット１５８を生成することができる。他の実施形態では、上述したように、最終関数３８４は、外部言語モデルへの問合せなど、任意の他の好適に資源集約的なプロセスを介して、意味表現２６２の一部分を考慮することができる。

【0092】

したがって、図１２に戻ると、類似性スコアリングサブシステム２６０は、ブロック４１６でＣＣＧ形式の探索の停止条件が満たされていると判定することができ、次いで探索部分空間５０２から識別された整合意味表現セット４３０を出力することができる。したがって、類似性スコアリングサブシステム２６０は、整合意味表現セット４３０を効率的に識別し、抽出されたアーティファクト１４０の後の判定のために、ＮＬＵフレームワーク１０４の他の構成要素へ提供することができる。

【0093】

本開示の技術的な効果は、サンプル発話から導出された意味表現が格納された探索空間をうまく狭める（たとえば、選り分ける）ことが可能な意味探索サブシステムを実施し、それによって受け取ったユーザ発話の意味表現に好適に整合する意味表現の識別を改善するエージェント自動化フレームワークを提供することを含む。本実施形態は特に、ＣＣＧ技法を介して意味表現を効率的かつ予測的に比較する意味探索サブシステムの類似性スコアリングサブシステムを対象とする。すなわち、特定の意味表現の識別されたＣＣＧ形式に基づいて、類似性スコアリングサブシステムは、意味表現間の類似性の定量化を有効にする数学的比較関数リストを判定することができる。リストの比較関数は、類似性スコアリングサブシステムが、意味表現間で最も効率的で最も安価な比較を実行し、それらの間の類似のスコアを判定することを有効にするように、経時的に順序付けられる。類似性スコアに基づいて、類似性スコアリングサブシステムは、探索空間内で特に類似している意味表現を反復して識別し、探索空間をこれらの意味表現に剪定（たとえば、縮小、低減）することができ、次いで意味表現の同じ数または増大させた数のノードにおいて、より計算集約的な比較関数を実施することができる。すなわち、選択的なノードの露出および／または増大する資源利用の反復的な適用は、概して、ますます複雑になる比較関数を介して、比較される意味表現のより多くのデータを考慮しながら、探索空間内の潜在的整合意味表現を絞り込む。したがって、予測的類似性スコアリングのための本技法は、意味表現整合の標的発見を有効にし、それによってＮＬＵフレームワークがアーティファクトを効率的に抽出することを有効にしながら、複数のユーザとの企業レベルの自然言語関与に好適なレベルまで計算経費を低減させる。

【0094】

上述した特有の実施形態は、例として示されており、これらの実施形態は、様々な修正および代替の形態を受けることができることを理解されたい。特許請求の範囲は、開示する特定の形態に限定されることを意図したものではなく、本開示の精神および範囲内のすべての修正、均等物、および代替を包含することを意図したものであることをさらに理解されたい。

【0095】

本明細書に提示および主張される技法は、本技術分野を実証可能に改善し、したがって抽象的、無形、または純粋に理論的ではない、実際的な性質の有形物および具体例に参照および適用される。さらに、本明細書の終わりに添付するいずれかの請求項が、「・・・［機能］を［実行］する手段」または「・・・［機能］を［実行］するステップ」と呼ばれる１つまたは複数の要素を含む場合、そのような要素は、米国特許法第１１２条（ｆ）に基づいて解釈されることが意図される。しかし、任意の他の形で呼ばれる要素を含む請求項の場合、そのような要素は、米国特許法第１１２条（ｆ）に基づいて解釈されるべきではないことが意図される。

【図1】