IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 北京小米智能科技有限公司の特許一覧

<>
  • 特許-自然言語処理方法、装置及び設備 図1
  • 特許-自然言語処理方法、装置及び設備 図2
  • 特許-自然言語処理方法、装置及び設備 図3
  • 特許-自然言語処理方法、装置及び設備 図4
  • 特許-自然言語処理方法、装置及び設備 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-07
(45)【発行日】2022-07-15
(54)【発明の名称】自然言語処理方法、装置及び設備
(51)【国際特許分類】
   G10L 15/22 20060101AFI20220708BHJP
   G06N 20/00 20190101ALI20220708BHJP
   G10L 15/16 20060101ALI20220708BHJP
   G06F 40/279 20200101ALI20220708BHJP
   G06F 40/216 20200101ALI20220708BHJP
【FI】
G10L15/22 300U
G06N20/00
G10L15/16
G06F40/279
G06F40/216
【請求項の数】 10
(21)【出願番号】P 2019564011
(86)(22)【出願日】2019-10-12
(65)【公表番号】
(43)【公表日】2021-12-16
(86)【国際出願番号】 CN2019110894
(87)【国際公開番号】W WO2021017173
(87)【国際公開日】2021-02-04
【審査請求日】2019-11-18
(31)【優先権主張番号】201910687763.0
(32)【優先日】2019-07-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】319003367
【氏名又は名称】北京小米智能科技有限公司
【氏名又は名称原語表記】Beijing Xiaomi Intelligent Technology Co.,Ltd.
【住所又は居所原語表記】NO.003, floor 3, building 6, yard 33, middle Xierqi Road, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110000796
【氏名又は名称】特許業務法人三枝国際特許事務所
(72)【発明者】
【氏名】銭 庄
【審査官】大野 弘
(56)【参考文献】
【文献】特開2018-132754(JP,A)
【文献】特開2018-163641(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/22
G06N 20/00
G10L 15/16
G06F 40/279
G06F 40/216
(57)【特許請求の範囲】
【請求項1】
自然言語処理方法であって、マンマシン対話システムにおける対話ロボットに適用され、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定することと、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することと、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うことと、を含
前記マンマシン対話システムは更に中央制御モジュールを備え、
使用されている前記BiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定した後、前記方法は、更に、
前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力することと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得することと、を含み、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる、
自然言語処理方法。
【請求項2】
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することは、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定することと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することと、を含む
請求項に記載の方法。
【請求項3】
ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することは、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定することと、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定することと、を含み、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである、
請求項に記載の方法。
【請求項4】
前記フィードバック情報に基づいてモデル強化学習を行うことは、
RF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおける前記CRF層にフィードバックすることを含む
請求項1~のいずれか1項に記載の方法。
【請求項5】
自然言語処理装置であって、
マンマシン対話システムにおける対話ロボットに適用され、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定するように構成されるスロットタギング結果確定モジュールと、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定するように構成されるフィードバック情報確定モジュールと、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成されるモデル強化学習モジュールと、を備え
前記マンマシン対話システムは更に中央制御モジュールを備え、
前記装置は、更に、
前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力するように構成されるスロットタギング結果出力モジュールと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得するように構成される目標スロットタギング結果確定モジュールと、を備え、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる、
自然言語処理装置。
【請求項6】
前記フィードバック情報確定モジュールは、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定するように構成される第1フィードバック情報確定サブモジュールと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定するように構成される第2フィードバック情報確定サブモジュールと、を含む
請求項に記載の装置。
【請求項7】
前記第2フィードバック情報確定サブモジュールは、具体的に、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定し、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するように構成され、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである、
請求項に記載の装置。
【請求項8】
前記モデル強化学習モジュールは、具体的に、
RF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおける前記CRF層にフィードバックするように構成される
請求項のいずれか1項に記載の装置。
【請求項9】
対話ロボットを備えるマンマシン対話装置であって、
プロセッサと、
プロセッサ実行可能命令を記憶するように構成されるメモリと、を備え、
前記プロセッサは、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定し、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定し、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成され
前記マンマシン対話装置は更に中央制御モジュールを備え、
使用されている前記BiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定した後、前記プロセッサは、更に、
前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力することと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得することと、を実行するように構成され、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる、
マンマシン対話装置。
【請求項10】
コンピュータ可読記憶媒体であって、
コンピュータプログラムが記憶され、前記プログラムがプロセッサにより実行されるとき、請求項1~のいずれか1項に記載の方法のステップを実現する、前記コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、2019年07月29日に提出した中国特許出願第201910687763.0号の優先権を主張し、ここで、該中国特許出願の全内容が本願の一部として援用される。
【0002】
本開示の実施例はマンマシン対話技術分野に関し、特に自然言語処理方法、装置及び設備に関する。
【背景技術】
【0003】
自然言語処理は、言語学、コンピュータサイエンス、数学を組み合わせる科学であり、人間とコンピュータとの間で自然言語を利用して効果的に通信する理論及び方法を研究している。自然言語処理において、シーケンスラベリングモデルはよく使用されているモデルであり、テキスト処理等の関連分野に広く使用されている。
【0004】
現在流行っている、シーケンスラベリング問題を解決する方法は、隠れマルコフモデル(HMM)、条件付確率場(CRFs)及びリカレントニューラルネットワーク(RNNs)を含む。しかしながら、上記モデルはいずれもモデル能力が限られているため、自己学習を行うことができないといった問題がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
関連技術の問題を解決するために、本開示の実施例は自然言語処理方法、装置及び設備を提供する。
【課題を解決するための手段】
【0006】
本開示の実施例に係る第1態様では、自然言語処理方法を提供し、前記方法はマンマシン対話システムにおける対話ロボットに適用され、前記方法は、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定することと、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することと、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うことと、を含む。
【0007】
好ましくは、前記マンマシン対話システムは更に中央制御モジュールを備え、
前記使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定した後、前記方法は、更に、
前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力することと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得することと、を含み、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる。
【0008】
好ましくは、前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することは、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定することと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することと、を含む。
【0009】
好ましくは、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することは、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定することと、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定することと、を含み、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである。
【0010】
好ましくは、前記フィードバック情報に基づいてモデル強化学習を行うことは、
前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックすることを含む。
【0011】
本開示の実施例に係る第2態様では、自然言語処理装置を提供し、前記装置はマンマシン対話システムにおける対話ロボットに適用され、前記装置は、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定するように構成されるスロットタギング結果確定モジュールと、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定するように構成されるフィードバック情報確定モジュールと、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成されるモデル強化学習モジュールと、を備える。
【0012】
好ましくは、前記マンマシン対話システムは更に中央制御モジュールを備え、
前記装置は、更に、
前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力するように構成されるスロットタギング結果出力モジュールと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得するように構成される目標スロットタギング結果確定モジュールと、を備え、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる。
【0013】
好ましくは、前記フィードバック情報確定モジュールは、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定するように構成される第1フィードバック情報確定サブモジュールと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定するように構成される第2フィードバック情報確定サブモジュールと、を含む。
【0014】
好ましくは、前記第2フィードバック情報確定サブモジュールは、具体的に、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定し、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するように構成され、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである。
【0015】
好ましくは、前記モデル強化学習モジュールは、具体的に、
前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックするように構成される。
【0016】
本開示の実施例に係る第3態様では、対話ロボットを備えるマンマシン対話装置を提供し、前記マンマシン対話装置は、
プロセッサと、
プロセッサ実行可能命令を記憶するように構成されるメモリと、を備え、
前記プロセッサは、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定し、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定し、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成される。
【0017】
本開示の実施例に係る第4態様では、コンピュータ可読記憶媒体を提供し、コンピュータプログラムが記憶され、前記プログラムがプロセッサにより実行されるとき、上記方法のステップを実現する。
【発明の効果】
【0018】
本開示の実施例に係る技術案は以下の有益な効果を有してもよい。
【0019】
本開示の実施例において、BiLSTM-CRFモデルを基本的なフレームとし、BiLSTM-CRFモデルがスロットタギング結果を外部に出力した後、対話ロボットは該スロットタギング結果に基づいて対応するフィードバック情報を取得して、該フィードバック情報に基づいてBiLSTM-CRFモデルに対して強化学習を行うことができ、これにより、モデルの動的な自己学習を実現し、それにより手動ラベリング過程を省略し、スロットタギング効率及び精度を向上させる。
【0020】
以上の一般的な説明及び以下の詳細な説明は例示的及び解釈的なものであって、本開示の実施例を制限するためのものではないと理解すべきである。
【図面の簡単な説明】
【0021】
図1図1は本開示の例示的な実施例に係る自然言語処理方法の実施例のフローチャートである。
図2図2は本開示の例示的な実施例に係る他の自然言語処理方法の実施例のフローチャートである。
図3図3は本開示の例示的な実施例に係るBiLSTM-CRFモデルの模式図である。
図4図4は本開示の例示的な実施例に係る自然言語処理装置の実施例のブロック図である。
図5図5は本開示の例示的な実施例に係るマンマシン対話装置のブロック図である。
【発明を実施するための形態】
【0022】
ここで、図面は明細書に援用されて本明細書の一部となり、本開示に適用される実施例を示し、且つ明細書とともに本開示の実施例の原理を解釈することに用いられる。
【0023】
ここで、例示的な実施例を詳しく説明し、その例を図面に示す。以下の説明は図面に関わるとき、特に断りがない限り、異なる図面における同じ数字は同様又は類似の要素を示す。以下の例示的な実施例に説明される実施形態は本開示の実施例に一致するすべての実施形態を代表しない。逆に、それらは単に添付の特許請求の範囲に詳しく説明された、本開示の実施例のいくつかの態様に一致する装置及び方法の例である。
【0024】
本開示の実施例に使用される用語は特定の実施例を説明するためのものであって、本開示の実施例を制限するためのものではない。コンテクストに他の意味を明確に示さない限り、本開示の実施例及び添付の特許請求の範囲に使用される単数形式の「1種」「前記」及び「該」は複数形式を含むように意図される。本明細書に使用される用語「及び/又は」は1つ又は複数の関連する列挙した項目を含む任意又はすべての可能な組み合わせを指すと更に理解すべきである。
【0025】
本開示の実施例において用語「第1」「第2」「第3」等を用いて異なる情報を説明する可能性があるが、このような情報がこれらの用語に限らないと理解すべきである。このような用語は同じタイプの情報を区別するためのものに過ぎない。例えば、本開示の実施例の範囲を逸脱せずに、第1情報が第2情報と称されてもよく、同様に、第2情報が第1情報と称されてもよい。コンテクストによって、ここで使用される用語「〇〇場合」は「○○時」又は「○○であれば」又は「確定することに応じて」と解釈されてもよい。
【0026】
図1は本開示の例示的な実施例に係る自然言語処理方法の実施例のフローチャートであり、本開示の実施例の方法はマンマシン対話システムにおける対話ロボットに適用されてもよく、具体的に、以下のステップを含んでもよい。
【0027】
ステップ101において、使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定する。
【0028】
該ステップでは、本対話ロボットがユーザーの入力した対話データを受信した場合、BiLSTM(Bi-directional Long Short-Term Memory、双方向長期短期記憶ネットワークアルゴリズム)-CRF(Conditional Random Field algorithm、条件付確率場アルゴリズム)モデルで該対話データに対してスロットタギングを行って、BiLSTM-CRFモデルの出力したスロットタギング結果を取得してもよい。スロットタギングがシーケンスラベリング問題を解決するシーケンスラベリングタスクであると理解されてもよい。
【0029】
ステップ102において、前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定する。
【0030】
該ステップでは、対話ロボットがスロットタギング結果を取得した後、更に該スロットタギング結果のフィードバック情報を確定してもよく、例示的に、該フィードバック情報がユーザーの該スロットタギング結果に対するフィードバックを含んでもよい。
【0031】
ステップ103において、前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行う。
【0032】
該ステップでは、対話ロボットは取得された該スロットタギング結果のフィードバック情報に基づき、BiLSTM-CRFモデルに対して強化学習を行うことができ、これにより、モデルの動的な自己学習を実現し、それにより手動ラベリング過程を省略し、スロットタギング効率及び精度を向上させる。
【0033】
図2は本開示の例示的な実施例に係る他の自然言語処理方法の実施例のフローチャートであり、本開示の実施例の方法はマンマシン対話システムにおける対話ロボットに適用されてもよく、具体的に、以下のステップを含んでもよい。
【0034】
ステップ201において、使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定する。
【0035】
スロットタギング(Slot tagging)はNLU(Natural Language Understanding、自然言語理解)モジュールの重要な構成部分であるが、NLUモジュールはマンマシン対話システムにおける最も重要な部分であり、NLUモジュール全体の機能は主にユーザー意図(Intent)に対する理解及びユーザーの表明したセンテンスにおけるコアスロット(Slot、すなわちスロット)に対する解析の2つを含む。意図(Intent)は1つの分類器であって、ユーザーの表明したセンテンスのタイプを確定し、更に確定されたタイプに対応するプログラム(すなわち、Bot(音声ロボット))により専門の解析を行う。例えば、ユーザーは
と言ったとき、ユーザーの意図の種類が音楽であると判断でき、従って、音楽ロボット(Bot)を呼び出してユーザーに一曲の歌を推薦して再生し、ユーザーが聞きたくない場合、「曲を変えてください」と言ったと、この音楽ロボットがユーザーにサービスを提供し続け、ユーザーが別の問題を出すまで、他のロボットに切り換えてユーザーにサービスを提供する。
【0036】
マンマシン対話システムは更にNLUモジュールと通信する1つの中央制御モジュールを備え、NLUモジュールが1つの対話センテンスに対して1種類を超える意図を解析した場合、中央制御モジュールによりユーザーの対話センテンスを、ユーザー意図を処理できるBot(すなわち、ChatBot、対話ロボット)に送信して、これらのBotによりその処理が完了した結果を返送する。
【0037】
そして、Botが対話センテンスの内容を理解すべきであり、簡単にするために、最も重要な部分を選択して理解して、他の重要でない内容を無視してもよいが、それらの最も重要な部分がスロットサイト(Slot)、すなわちスロットと称される。
【0038】
本開示の実施例の対話ロボットBotがBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行ってもよい。スロットタギングがシーケンスラベリング問題を解決するシーケンスラベリングタスクであると理解されてもよい。
【0039】
以下、中国語のセンテンスを例として、BiLSTM-CRFモデルでスロットタギングを行う過程は以下のとおりである。
【0040】
n個のワードを含む1つのセンテンス(ワードのシーケンス)は、
x=(x,x,・・・,x
と記され、
がセンテンスにおけるi番目のワードの辞書でのidを示し、更に各ワードのワンホット(one-hot)ベクトルを取得でき、次元が辞書サイズである。
【0041】
図3のBiLSTM-CRFモデルの模式図に示すように、
モデルの第1層がルックアップ層(look-up layer)であり、予め訓練又はランダムに初期化された埋め込み(embedding)マトリクスを利用してセンテンスにおける各ワードをone-hotベクトルから低次元高密度のワードベクトルにマッピングし、次の層に入力する前に、dropout(ドロップアウトは深層構造を有するニューラルネットワークを最適化する方法であって、学習過程において隠れ層の一部の重み又は出力をランダムにゼロにし、ノード間の依存性を低下させることにより、ニューラルネットワークの正規化を実現し、ニューラルネットワークの過学習を防止する)を設定することにより過学習を緩和する。
【0042】
モデルの第2層は双方向LSTM(Long Short-Term Memory、長期短期記憶ネットワーク)層であって、正方向長期短期記憶ネットワーク(forward LSTM)及び逆方向長期短期記憶ネットワーク(backward LSTM)を含む。1つのセンテンスの各ワードのchar embedding(文字埋め込み)シーケンス(x,x,・・・,x)を双方向LSTMの各タイムステップの入力とし、次に正方向LSTMから出力された
隠れ状態シーケンスと逆方向LSTMから各位置で出力された
隠れ状態シーケンスとを位置によって組み合わせて、完全な隠れ状態シーケンスを取得する。
【0043】
dropoutを設定した後、1つの線形層にアクセスし、隠れ状態ベクトルをm次元からk次元にマッピングし、kがラベリングセットのタグ数であり、これにより、出力層(LSTM’s output)が自動的に抽出された、マトリクスP=(p,p,・・・,p)と記されるセンテンス特徴を出力する。
【0044】
モデルの第3層はCRF層であって、センテンスレベルのシーケンスラベリングを行い、CRF層のパラメータが1つの(k+2)*(k+2)のマトリクスAであり、Aijがi番目のタグからj番目のタグまでの転送スコアを示し、更に一箇所をラベリングするとき、この前にラベリングされたタグを利用してもよく、2を加える理由はセンテンスの冒頭に1つの開始状態を追加して、センテンスの末尾に1つの終了状態を追加するためである。
【0045】
図3によれば、「中国特大」(中国がとても大きい)のセンテンスに対して、BiLSTM-CRFモデルの最終的に出力したスロットタギング結果は、
【0046】
「中 国 特 大
B-LOC I-LOC O O」であり、
【0047】
BIOラベリングセットにおいて、B-PER、I-PERがそれぞれ人名の頭文字、人名の非頭文字を示し、B-LOC、I-LOCがそれぞれ地名の頭文字、地名の非頭文字を示し、B-ORG、I-ORGがそれぞれ組織機構名の頭文字、組織機構名の非頭文字を示し、Oは該ワードが命名実体の一部に属しないことを示す。当然ながら、特定の分野では、ユーザーが更にそれに応じて分野内の様々な実体タイプ、例えば映画タイプ(video)、天気タイプ(weather)等のタイプを定義する。
【0048】
ステップ202において、前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力する。
【0049】
ステップ203において、受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得する。
【0050】
該実施例において、対話ロボットがBiLSTM-CRFモデルの出力したスロットタギング結果を取得した後、該スロットタギング結果を中央制御モジュールに出力してもよい。中央制御モジュールについては、異なる対話ロボットBotから送信された、同じ対話データに対するスロットタギング結果を受信して、スロットタギング結果集合を構成することができ、その場合、スロットタギング結果集合にはBiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果が含まれてもよい。
【0051】
実際には、NLUモジュールが1つの対話センテンスに対して1種類を超える意図を解析した場合、中央制御モジュールにより確定され、つまり、複数種類の意図から1種類の意図をユーザー意図として確定して、ユーザー意図に対応する少なくとも1つのBotを確定してそれぞれ解析処理を行って、処理後のスロットタギング結果集合を取得してもよい。その後、中央制御モジュールがスロットタギング結果集合からユーザー意図に最もマッチングする目標スロットタギング結果を確定してもよく、該目標スロットタギング結果がマンマシン対話システムからのユーザーへの応答結果として出力されてもよい。
【0052】
ステップ204において、前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定する。
【0053】
本実施例は目標スロット結果とBiLSTM-CRFモデルの出力したスロットタギング結果との比較結果と組み合わせて、BiLSTM-CRFモデルの出力したスロットタギング結果のフィードバック情報を確定することができる。
【0054】
一例として、該フィードバック情報は正フィードバック情報及び負フィードバック情報を含んでもよい。例えば、正フィードバック情報は数値1で示されてもよく、負フィードバック情報は数値-1で示されてもよい。
【0055】
該ステップでは、BiLSTM-CRFモデルの出力したスロットタギング結果と目標スロットタギング結果とが一致しない場合、フィードバック情報を負フィードバック情報として確定してもよい。
【0056】
一実現方式では、本対話ロボットはフィードバック計算機(Reward Calculator)を設定して現在のスロットタギング結果のフィードバック情報を記録することができる。例えば、上記フィードバック情報を負フィードバック情報として確定する場合、Reward Calculatorの記録がreward=-1である。
【0057】
ステップ205において、前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定する。
【0058】
該ステップでは、BiLSTM-CRFモデルの出力したスロットタギング結果と目標スロットタギング結果とが一致する場合、ユーザーの応答結果に対するフィードバック操作によってフィードバック情報を確定してもよい。
【0059】
つまり、BiLSTM-CRFモデルの出力したスロットタギング結果と目標スロットタギング結果とが一致しても、ユーザーの応答結果に対するフィードバック操作によってフィードバック情報を確定することもでき、その理由はユーザーが応答結果の合理性を判断する真の判断側であるためである。
【0060】
本開示の実施例の可能な実施形態において、ステップ205は、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定するサブステップS11と、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するサブステップS12と、を含んでもよい。
【0061】
正方向フィードバック率が所定期間内のユーザーの応答結果に対するフィードバック操作によって確定される。
【0062】
実際には、1つの時間帯内に複数のユーザーがマンマシン対話システムに同様又は類似の対話データを出す可能性がある場合、該対話データに対して、BiLSTM-CRFモデルの出力したスロットタギング結果を応答結果とすれば、該時間帯内の複数のユーザーの該応答結果に対するフィードバック操作(例えば、クリック又はサムズアップ等の操作)を統計することができ、正方向フィードバック率が所定閾値以上である場合、ユーザーのフィードバックが正のフィードバックであることを示し、この時、該スロットタギング結果のフィードバック情報を正フィードバック情報、すなわちreward=1として確定してもよく、そうでない場合、つまり、正方向フィードバック率が所定閾値より小さい場合、ユーザーのフィードバックが負のフィードバックであることを示し、この時、該スロットタギング結果のフィードバック情報を負フィードバック情報、すなわちreward=-1として確定してもよい。
【0063】
フィードバック情報を確定した後、更に該フィードバック情報をキャッシュ領域に記憶して、以下の使用に備えてもよい。
【0064】
ステップ206において、前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックする。
【0065】
該ステップでは、Reward CalculatorはBiLSTM-CRFモデルの出力したスロットタギング結果のフィードバック情報を確定した後、記録されたフィードバック情報をBiLSTM-CRFモデルのCRF層にフィードバックすることができ、CRF層が各スロットタギング結果及び対応するフィードバック情報を訓練データとしてモデルの強化学習訓練を行い、強化学習によって学習全体の閉ループを完了し、それにより訓練後のBiLSTM-CRFモデルがより正確なスロットタギング結果を取得できる。
【0066】
一例では、BiLSTM-CRFモデルに対して強化学習を行うための4つの要素は、
スロットタギング結果YであるActionと、
識別対象シーケンスXであるStateと、
p(y|x)、すなわちシーケンスXの条件下で結果Yを生成する確率であるPolicyと、
フィードバック情報であるRewardと、を含んでもよい。
【0067】
本実施例において、BiLSTM-CRFモデルの出力したスロットタギング結果を取得した後、中央制御モジュール及びユーザーの該スロットタギング結果に対するフィードバックと組み合わせて、フィードバック情報を確定してもよく、ユーザーによるラベリングを省略し、該フィードバック情報をBiLSTM-CRFモデルのCRF層に返送して強化学習を行うことにより、BiLSTM-CRFモデルの精度を向上させることができる。
【0068】
当業者が本開示の実施例をよく理解するために、以下に具体例を挙げて本開示の実施例を例示的に説明する。
【0069】
例えば、ユーザーの入力した対話データが「明日の天気」であり、「明日の天気」が1つの映画名であるため、BiLSTM-CRFモデルが「明日の天気」に対してスロットタギングを行った後、出力したスロットタギング結果が「明日の天気/video」である。中央制御モジュールは複数のBotから送信されたスロットタギング結果を受信した後、最終的に該対話データのユーザー意図が天気であると確定したため、最終的に取得した目標スロットタギング結果が「明日/date 天気/weather」である。Reward Calculatorは中央制御モジュールの確定した目標スロットタギング結果を取得した後、それをBiLSTM-CRFモデルの出力したスロットタギング結果にマッチングし、それらが一致しない(一方がvideoの結果であるが、他方がweatherの結果である)と判定するため、該BiLSTM-CRFモデルの出力したスロットタギング結果のフィードバック情報をreward=-1として設定する。
【0070】
逆に、中央制御モジュールの最終的に確定した該対話データの意図がvideoであるため、最終的に取得した目標スロットタギング結果が「明日の天気/video」である。Reward Calculatorは中央制御モジュールの確定した目標スロットタギング結果を取得した後、それをBiLSTM-CRFモデルの出力したスロットタギング結果にマッチングし、それらが一致する(いずれもvideoの結果である)と判定し、この時、Reward Calculatorは所定期間内のユーザーの該目標スロットタギング結果に対する応答結果(例えば、中央制御モジュールがユーザーに「明日の天気の映画資源」を返信する)のクリック率を統計し、クリック率がより低い(所定閾値より低い)場合、該応答結果がユーザーを満たさないと見なされ、該スロットタギング結果のフィードバック情報をreward=-1として設定してもよく、逆に、クリック率がより高い(所定閾値より高い)場合、該応答結果がユーザーを満たすと見なされ、該スロットタギング結果のフィードバック情報をreward=1として設定してもよい。
【0071】
Reward Calculatorがフィードバック情報をBiLSTM-CRFモデルにフィードバックし、モデルが動的な自己学習を行うため、reward=-1と仮定する場合、モデルが再び「明日の天気」の対話データを受信した場合、それがvideoのラベリング結果に属さず、weatherのラベリング結果に属すると判定し、出力した識別結果が「明日/date 天気/weather」であり、それにより学習の目的を実現する。
【0072】
以上の実施形態の様々な技術的特徴は任意に組み合わせられてもよく、紙幅の都合上、ここで詳しく説明しないが、特徴同士の組み合わせが衝突又は矛盾しない限り、上記実施形態の様々な技術的特徴の任意の組み合わせも本明細書に開示される範囲に属する。
【0073】
上記自然言語処理方法の実施例に対応して、本開示の実施例は更に自然言語処理装置の実施例を提供する。
【0074】
図4に示すように、図4は本開示の例示的な実施例に係る自然言語処理装置の実施例のブロック図であり、本開示の実施例の装置はマンマシン対話システムにおける対話ロボットに適用され、該装置は、具体的に、
使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定するように構成されるスロットタギング結果確定モジュール401と、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定するように構成されるフィードバック情報確定モジュール402と、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成されるモデル強化学習モジュール403と、を備えてもよい。
【0075】
上記実施例によれば、本開示の実施例において、スロットタギング結果確定モジュール401がBiLSTM-CRFモデルの出力したスロットタギング結果を取得して、フィードバック情報確定モジュール402によって該スロットタギング結果及びユーザーの該スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することにより、手動ラベリング量を減少させる。次に、モデル強化学習モジュール403が該フィードバック情報に基づいてBiLSTM-CRFモデルに対して強化学習を行うことにより、モデルの動的な自己学習を実現し、それによりモデルのスロットタギング精度を向上させることができる。
【0076】
本開示の実施例の好適な実施例において、マンマシン対話システムは更に中央制御モジュールを備え、前記装置は、更に、
前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力するように構成されるスロットタギング結果出力モジュールと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得するように構成される目標スロットタギング結果確定モジュールと、を備え、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる。
【0077】
本開示の実施例の他の好適な実施例において、前記フィードバック情報確定モジュール402は、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないように応答して、前記一致しないフィードバック情報を負フィードバック情報として確定するように構成される第1フィードバック情報確定サブモジュールと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致するように応答して、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定するように構成される第2フィードバック情報確定サブモジュールと、を含んでもよい。
【0078】
上記実施例によれば、ラベリング精度を向上させるよう、フィードバック情報は中央処理モジュールのフィードバック情報及びユーザーのフィードバック情報を含んでもよく、フィードバック情報の確定次元を増加させる。
【0079】
本開示の実施例の好適な実施例において、前記第2フィードバック情報確定サブモジュールは、具体的に、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定し、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するように構成され、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである。
【0080】
上記実施例によれば、フィードバック情報のラベリングを行うとき、中央制御モジュール及びユーザーのフィードバック情報と組み合わせて分析してもよく、それによりラベリング精度を向上させることができる。
【0081】
本開示の実施例の好適な実施例において、前記モデル強化学習モジュール403は、具体的に、
前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックするように構成される。
【0082】
上記実施例によれば、モデル強化学習モジュール403がフィードバック情報に基づいてモデル強化学習を行うことにより、モデルの動的な自己学習を実現し、モデルのスロットタギング精度を向上させることができる。
【0083】
上記装置における各モジュールの機能及び作用の実現過程の具体的な詳細は上記システム実施例の具体的な説明を参照してもよく、ここで詳細な説明は省略する。
【0084】
装置実施例については、それは基本的にシステム実施例に対応するため、関連箇所はシステム実施例の説明の一部を参照してもよい。以上に説明される装置実施例は模式的なものに過ぎず、分離部材として説明される前記ユニットは物理的に分離してもよいし、物理的に分離しなくてもよく、ユニットとして表示される部材は物理ユニットであってもよいし、物理ユニットでなくてもよく、つまり、一箇所に位置してもよいし、複数のネットワークユニットに配置されてもよい。実際の必要に応じて、その一部又は全部のモジュールを選択して本開示の実施例の解決手段の目的を実現してもよい。当業者であれば、創造的な労力を要することなく、理解し実施できる。
【0085】
図5に示すように、図5は本開示の例示的な実施例に係るマンマシン対話装置500のブロック図である。
【0086】
図5に示すように、装置500は処理コンポーネント502、メモリ504、電源コンポーネント506、マルチメディアコンポーネント508、オーディオコンポーネント510、入力/出力(I/O)インターフェース512、センサコンポーネント514及び通信コンポーネント516のうちの1つ又は複数を備えてもよい。
【0087】
処理コンポーネント502は一般的に装置500の全体操作を制御し、上記方法の全部又は一部のステップを完了するよう、処理コンポーネント502は命令を実行するために1つ又は複数のプロセッサ520を備えてもよい。なお、処理コンポーネント502は処理コンポーネント502と他のコンポーネントとの相互作用に役立つ1つ又は複数のモジュールを備えてもよい。例えば、処理コンポーネント502はマルチメディアコンポーネント508と処理コンポーネント502との相互作用に役立つマルチメディアモジュールを備えてもよい。
【0088】
メモリ504は装置500における操作をサポートするために様々なタイプのデータを記憶するように構成される。これらのデータの例は装置500において操作するためのいかなるアプリケーションプログラム又は方法の命令を含む。メモリ504はいかなるタイプの揮発性記憶装置又は不揮発性記憶装置、例えばスタティックランダムアクセスメモリ(SRAM)、電気的消去可能プログラム可能読み出し専用メモリ(EEPROM)、消去可能プログラム可能読み出し専用メモリ(EPROM)、プログラム可能読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスク、又はそれらの組み合わせで実現されてもよい。
【0089】
電源コンポーネント506は装置500の様々なコンポーネントに電力を提供する。電源コンポーネント506は電源管理システム、1つ又は複数の電源及び装置500への電力の生成、管理及び分配に関連する他のコンポーネントを備えてもよい。
【0090】
マルチメディアコンポーネント508は前記装置500とユーザーとの間に1つの出力インターフェースを提供するスクリーンを備える。いくつかの実施例において、スクリーンは液晶ディスプレイ(LCD)及びタッチパネル(TP)を含んでもよい。スクリーンはタッチパネルを含む場合、ユーザーからの入力信号を受信するよう、スクリーンはタッチスクリーンとして実現されてもよい。タッチ、スワイプ及びタッチパネルにおけるジェスチャーを検知するよう、タッチパネルは1つ又は複数のタッチセンサを備える。前記タッチセンサはタッチ又はスワイプ動作の境界を検知するだけでなく、更に前記タッチ又はスワイプ操作に関連する持続時間及び圧力を検出することができる。オーディオコンポーネント510はオーディオ信号を出力及び/又は入力するように構成される。例えば、オーディオコンポーネント510は1つのマイクロフォン(MIC)を備え、装置500が操作モード、例えばコールモード、記録モード及び音声識別モードにある場合、マイクロフォンは外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は更にメモリ504に記憶され又は通信コンポーネント516により送信されてもよい。いくつかの実施例において、オーディオコンポーネント510は更にオーディオ信号を出力するための1つの拡声器を備える。
【0091】
I/Oインターフェース512は処理コンポーネント502と周辺インターフェースモジュールとの間にインターフェースを提供し、上記周辺インターフェースモジュールはキーボード、クリックホイール、ボタン等であってもよい。これらのボタンはホームページボタン、音量ボタン、スタートボタン及びロックボタンを含んでもよいが、それらに限らない。
【0092】
センサコンポーネント514は装置500に各態様の状態評価を提供するための1つ又は複数のセンサを備える。例えば、センサコンポーネント514は装置500のオン/オフ状態、コンポーネントの相対位置決めを検出することができ、例えば前記コンポーネントは装置500のディスプレイ及びキーパッドであり、センサコンポーネント514は更に装置500又は装置500の1つのコンポーネントの位置変化、ユーザーが装置500に接触しているかどうか、装置500の方位又は加速/減速及び装置500の温度変化を検出することができる。センサコンポーネント514は物理的に接触しない際に近傍に物体があるかどうかを検出するように構成される接近センサを備えてもよい。センサコンポーネント514は更にイメージングアプリケーションに使用されるための光センサ、例えばCMOS又はCCD画像センサを備えてもよい。いくつかの実施例において、該センサコンポーネント514は更に加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサ又は温度センサを含んでもよい。
【0093】
通信コンポーネント516は装置500と他の装置との有線又は無線方式の通信に役立つように構成される。装置500は通信規格に基づく無線ネットワーク、例えばWiFi(登録商標)、2G又は5G、又はそれらの組み合わせにアクセスすることができる。1つの例示的な実施例において、通信コンポーネント516は放送チャネルを介して外部放送管理システムからのブロードキャスト信号又はブロードキャスト関連情報を受信する。1つの例示的な実施例において、近距離通信を促進するよう、前記通信コンポーネント516は更に近距離無線通信(NFC)モジュールを備える。例えば、NFCモジュールは無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術又は他の技術により実現されてもよい。
【0094】
例示的な実施例において、上記方法を実行するために、装置500は1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又は他の電子素子により実現されてもよい。
【0095】
例示的な実施例において、更に命令を含む非一時的コンピュータ可読記憶媒体、例えば命令を含むメモリ504を提供し、上記方法を完了するために、上記命令が装置500のプロセッサ520により実行されてもよい。例えば、前記非一時的コンピュータ可読記憶媒体はROM、CD-ROM、磁気テープ、フロッピー(登録商標)ディスク及び光データ記憶装置等であってもよい。
【0096】
前記記憶媒体における命令が前記プロセッサにより実行されるとき、装置500は自然言語処理方法を実行することができ、前記方法は、使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定することと、前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することと、前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うことと、を含む。
【0097】
当業者が明細書を考慮し及びここで開示される発明を実践した後、本開示の実施例の他の実施形態に容易に想到し得る。本開示の実施例は本開示の実施例のいかなる変形、用途又は適応変化を含むように意図され、これらの変形、用途又は適応変化は本開示の実施例の一般原理に従い且つ本開示の実施例に開示されていない本技術分野における周知の知識又は慣用の技術的手段を含む。明細書及び実施例は例示的なものであると見なされ、本開示の実施例の真の範囲及び趣旨は以下の特許請求の範囲に準じる。
【0098】
本開示の実施例は以上に説明されて図面に示される正確な構造に限らず、その範囲を逸脱せずに、種々の修正や変更を行うことができると理解すべきである。本開示の実施例の範囲は添付の特許請求の範囲により制限される。
【0099】
以上の説明は本開示の実施例の好適な実施例であって、本開示の実施例を制限するためのものではなく、本開示の実施例の趣旨及び原則内に行ったいかなる修正、等価置換、改良等は、いずれも本開示の実施例の保護範囲内に含まれるべきである。
【産業上の利用可能性】
【0100】
本開示の実施例において、BiLSTM-CRFモデルを基本的なフレームとし、BiLSTM-CRFモデルがスロットタギング結果を外部に出力した後、対話ロボットは該スロットタギング結果に基づいて対応するフィードバック情報を取得して、該フィードバック情報に基づいてBiLSTM-CRFモデルに対して強化学習を行うことができ、これにより、モデルの動的な自己学習を実現し、それにより手動ラベリング過程を省略し、スロットタギング効率及び精度を向上させる。
図1
図2
図3
図4
図5