IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 犀動智能科技股▲ふん▼有限公司の特許一覧

特許7617971言語データ処理システム、言語データ処理方法、及びコンピュータープログラム
<>
  • 特許-言語データ処理システム、言語データ処理方法、及びコンピュータープログラム 図1
  • 特許-言語データ処理システム、言語データ処理方法、及びコンピュータープログラム 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-01-09
(45)【発行日】2025-01-20
(54)【発明の名称】言語データ処理システム、言語データ処理方法、及びコンピュータープログラム
(51)【国際特許分類】
   G06F 40/30 20200101AFI20250110BHJP
   G10L 15/10 20060101ALI20250110BHJP
   G06F 40/216 20200101ALI20250110BHJP
【FI】
G06F40/30
G10L15/10 200W
G06F40/216
【請求項の数】 11
(21)【出願番号】P 2023070061
(22)【出願日】2023-04-21
(65)【公開番号】P2024077568
(43)【公開日】2024-06-07
【審査請求日】2023-04-21
(31)【優先権主張番号】111145456
(32)【優先日】2022-11-28
(33)【優先権主張国・地域又は機関】TW
(73)【特許権者】
【識別番号】522502026
【氏名又は名称】犀動智能科技股▲ふん▼有限公司
(74)【代理人】
【識別番号】100124039
【弁理士】
【氏名又は名称】立花 顕治
(74)【代理人】
【識別番号】100207217
【弁理士】
【氏名又は名称】樋口 智夫
(72)【発明者】
【氏名】▲黄▼ 信橋
(72)【発明者】
【氏名】馬 世英
(72)【発明者】
【氏名】沈 書緯
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開2022-013610(JP,A)
【文献】米国特許出願公開第2016/0155443(US,A1)
【文献】米国特許出願公開第2021/0035552(US,A1)
【文献】特開2012-248161(JP,A)
【文献】特開平04-338817(JP,A)
【文献】特表2018-534652(JP,A)
【文献】米国特許出願公開第2017/0357637(US,A1)
【文献】米国特許出願公開第2020/0258514(US,A1)
【文献】米国特許出願公開第2015/0228275(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
G10L 15/00-15/34
(57)【特許請求の範囲】
【請求項1】
処理ユニットと、
前記処理ユニットに電気的に接続する記憶ユニットと、を含み、
前記記憶ユニットには、機械学習技術により実現される言語処理モデルが格納されており、前記言語処理モデルは、前記処理ユニットにより実行される複数の制御手順に対応する複数の意図タグを含み、
前記処理ユニットは、
前記言語処理モデルを用いて、テキストデータを解析することにより、該テキストデータが表すと共にそれぞれが1つの前記意図タグに対応する複数の指定意図を得て、さらに、前記テキストデータに基づいて、前記指定意図のそれぞれが明確な指定意図または曖昧な指定意図であるかを判断し、
少なくとも1つの前記指定意図が前記曖昧な指定意図であると判断される場合において、前記曖昧な指定意図であると判断される前記指定意図のうちの1つについて、前記言語処理モデルを用いて、該指定意図に対応する質問メッセージを生成し、前記質問メッセージを出力し、該質問メッセージに関連する追加のテキストデータを得ると、該質問メッセージが対応する前記指定意図に前記追加のテキストデータが意味的にマッチングするかどうかを判断し、且つ、該質問メッセージが対応する前記指定意図が対応する前記制御手順を前記追加のテキストデータに基づいて実行することができるかどうかを判断し、前記追加のテキストデータが前記指定意図に意味的にマッチングすると判断され、且つ、前記追加のテキストデータに基づいて前記制御手順を実行できると判断される場合において、該指定意図が前記明確な指定意図であると判断し、
前記明確な指定意図であると判断された前記指定意図から少なくとも1つの目標の指定意図を決定し、
前記目標の指定意図が対応する前記意図タグが対応する前記制御手順を実行するように構成される、
言語データ処理システム。
【請求項2】
前記処理ユニットは、前記指定意図のそれぞれについて、対応の前記制御手順を実行できるようなキー単語が前記テキストデータにあるかどうかを判断し、前記キー単語があると判断される場合において、該指定意図が前記明確な指定意図であると判断し、前記キー単語がないと判断される場合において、該指定意図が前記曖昧な指定意図であると判断することにより、前記指定意図のそれぞれが前記明確な指定意図または前記曖昧な指定意図であるかを判断するように構成される、請求項1に記載の言語データ処理システム。
【請求項3】
前記処理ユニットは、前記明確な指定意図であると判断される前記指定意図に、互いに背反する複数の前記指定意図があるかどうかを判断し、互いに背反する複数の前記指定意図があると判断される場合において、互いに背反する複数の前記指定意図から、前記目標の指定意図の1つとする1つの前記指定意図を選択することにより、前記目標の指定意図を決定するように構成される、請求項1に記載の言語データ処理システム。
【請求項4】
前記意図タグのうちの1つが、排他的な意図タグであり、
前記処理ユニットは、前記明確な指定意図であると判断される前記指定意図が対応する前記意図タグに、前記排他的な意図タグである前記意図タグが含まれているかどうかを判断し、前記排他的な意図タグである前記意図タグが含まれていると判断される場合において、前記排他的な意図タグである該意図タグに対応する前記指定意図を唯一の前記目標の指定意図とすることにより、前記目標の指定意図を決定するように構成される、請求項1に記載の言語データ処理システム。
【請求項5】
複数の前記意図タグは順序性を有し、
前記処理ユニットは、前記目標の指定意図と決定された前記指定意図が複数である場合において、前記目標の指定意図が対応する前記意図タグの順序に従って、前記目標の指定意図が対応する前記意図タグが対応する前記制御手順を実行することにより、前記制御手順を実行するように構成される、請求項1に記載の言語データ処理システム。
【請求項6】
言語データ処理システムにより実行される言語データ処理方法であって、
前記言語データ処理システムは、処理ユニットと、前記処理ユニットに電気的に接続する記憶ユニットと、を含み、
前記記憶ユニットには、機械学習技術により実現される言語処理モデルが格納されており、前記言語処理モデルは、前記処理ユニットにより実行される複数の制御手順に対応する複数の意図タグを含み、
前記言語データ処理方法は、
前記処理ユニットが、前記言語処理モデルを用いて、テキストデータを解析することにより、該テキストデータが表すと共にそれぞれが1つの前記意図タグに対応する複数の指定意図を得て、さらに、前記テキストデータに基づいて、前記指定意図のそれぞれが明確な指定意図または曖昧な指定意図であるかを判断するステップと、
少なくとも1つの前記指定意図が前記曖昧な指定意図であると判断される場合において、前記曖昧な指定意図であると判断される前記指定意図のうちの1つについて、前記処理ユニットが、前記言語処理モデルを用いて、該指定意図に対応する質問メッセージを生成し、前記質問メッセージを出力し、該質問メッセージに関連する追加のテキストデータを得ると、該質問メッセージが対応する前記指定意図に前記追加のテキストデータが意味的にマッチングするかどうかを判断し、且つ、該質問メッセージが対応する前記指定意図が対応する前記制御手順を前記追加のテキストデータに基づいて実行することができるかどうかを判断し、前記追加のテキストデータが前記指定意図に意味的にマッチングすると判断され、且つ、前記追加のテキストデータに基づいて前記制御手順を実行できると判断される場合において、該指定意図が前記明確な指定意図であると判断するステップと、
前記処理ユニットが、前記明確な指定意図であると判断された前記指定意図から少なくとも1つの目標の指定意図を決定するステップと、
前記処理ユニットが、前記目標の指定意図が対応する前記意図タグが対応する前記制御手順を実行するステップと、を含む、
言語データ処理方法。
【請求項7】
前記処理ユニットは、前記指定意図のそれぞれについて、対応の前記制御手順を実行できるようなキー単語が前記テキストデータにあるかどうかを判断し、前記キー単語があると判断される場合において、該指定意図が前記明確な指定意図であると判断し、前記キー単語がないと判断される場合において、該指定意図が前記曖昧な指定意図であると判断することにより、前記指定意図のそれぞれが明確な指定意図または曖昧な指定意図であるかを判断する、請求項に記載の言語データ処理方法。
【請求項8】
少なくとも1つの目標の指定意図を決定するステップは、前記処理ユニットが、前記明確な指定意図であると判断される前記指定意図に、互いに背反する複数の前記指定意図があるかどうかを判断し、互いに背反する複数の前記指定意図があると判断される場合において、互いに背反する複数の前記指定意図から、前記目標の指定意図の1つとする1つの前記指定意図を選択することを含む、請求項に記載の言語データ処理方法。
【請求項9】
前記意図タグのうちの1つが、排他的な意図タグであり、
少なくとも1つの目標の指定意図を決定するステップは、前記処理ユニットが、前記明確な指定意図であると判断される前記指定意図が対応する前記意図タグに、前記排他的な意図タグである前記意図タグが含まれているかどうかを判断し、前記排他的な意図タグである前記意図タグが含まれていると判断される場合において、前記排他的な意図タグである該意図タグに対応する前記指定意図を唯一の前記目標の指定意図とすることを含む、請求項に記載の言語データ処理方法。
【請求項10】
複数の前記意図タグは順序性を有し、
前記制御手順を実行するステップは、前記目標の指定意図と決定された前記指定意図が複数である場合において、前記処理ユニットが、前記目標の指定意図が対応する前記意図タグの順序に従って、前記目標の指定意図が対応する前記意図タグが対応する前記制御手順を実行することを含む、請求項に記載の言語データ処理方法。
【請求項11】
電子装置により実行されるコンピュータープログラムであって、
前記コンピュータープログラムは、機械学習技術により実現される言語処理モデルを含み、前記言語処理モデルは、前記電子装置により実行される複数の制御手順に対応する複数の意図タグを含み、
該コンピュータープログラムが前記電子装置により実行されると、前記電子装置に請求項から10のいずれか一項に記載の方法を実行させる、コンピュータープログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理システムに関し、特に、ユーザが口述した内容を処理する言語データ処理システムに関する。本発明は、さらに、ユーザが口述した内容を処理する言語データ処理方法と、電子装置に言語データ処理方法を実行させるコンピュータープログラムに関する。
【背景技術】
【0002】
言語処理技術の発展に伴い、音声操作可能な電子装置を操作しようとする際に、ユーザは、特定の音声コマンドに限定されることなく、より日常的な表現で該電子装置にコマンドを発することができる。
【0003】
一般的な話し方の習慣からすると、便利上、複数の要求を1つの文章で表現する。しかしながら、このような表現は、文章が長くなり、一部の要求が明確に表現されておらず、従来の自然言語処理を用いて処理しようとする際に支障が生じる。
【先行技術文献】
【特許文献】
【0004】
【文献】中国特許出願公開第114153956号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
従って、本発明の目的は、従来技術の少なくとも一つの短所を改善することができる言語データ処理システム、言語データ処理方法、及びコンピュータープログラムを提供することにある。
【課題を解決するための手段】
【0006】
言語データ処理システムは、処理ユニットと、処理ユニットに電気的に接続する記憶ユニットと、を含む。
【0007】
記憶ユニットには、機械学習技術により実現される言語処理モデルが格納されている。言語処理モデルは、処理ユニットにより実行される複数の制御手順に対応する複数の意図タグを含む。
【0008】
処理ユニットは、言語処理モデルを用いて、テキストデータを解析することにより、該テキストデータが表すと共にそれぞれが1つの意図タグに対応する複数の指定意図を得て、さらに、テキストデータに基づいて、指定意図のそれぞれが明確な指定意図または曖昧な指定意図であるかを判断し、明確な指定意図であると判断された指定意図から少なくとも1つの目標の指定意図を決定し、目標の指定意図が対応する意図タグが対応する制御手順を実行するように構成される。
【0009】
言語データ処理方法は、言語データ処理システムにより実行される。
【0010】
言語データ処理システムは、処理ユニットと、処理ユニットに電気的に接続する記憶ユニットと、を含む。記憶ユニットには、機械学習技術により実現される言語処理モデルが格納されている。言語処理モデルは、処理ユニットにより実行される複数の制御手順に対応する複数の意図タグを含む。
【0011】
言語データ処理方法は、処理ユニットが、言語処理モデルを用いて、テキストデータを解析することにより、該テキストデータが表すと共にそれぞれが1つの意図タグに対応する複数の指定意図を得て、さらに、テキストデータに基づいて、指定意図のそれぞれが明確な指定意図または曖昧な指定意図であるかを判断するステップと、処理ユニットが、明確な指定意図であると判断された指定意図から少なくとも1つの目標の指定意図を決定するステップと、処理ユニットが、目標の指定意図が対応する意図タグが対応する制御手順を実行するステップと、を含む。
【0012】
コンピュータープログラムは、電子装置により実行される。
【0013】
コンピュータープログラムは、機械学習技術により実現される言語処理モデルを含み、言語処理モデルは、電子装置により実行される複数の制御手順に対応する複数の意図タグを含む。
【0014】
該コンピュータープログラムが電子装置により実行されると、電子装置に前述の言語データ処理方法を実行させる。
【発明の効果】
【0015】
テキストデータから指定意図を解析し、指定意図のそれぞれについて該指定意図が明確な指定意図または曖昧な指定意図であるかを判断し、明確な指定意図と判断される指定意図のみについて対応の制御手順を実行する。従って、テキストデータが表す一部の指定意図が明確でなくても(すなわち、曖昧な指定意図があっても)、言語データ処理システムは、明確に表現された指定意図(すなわち、明確な指定意図)について、対応の手順を実行し、ユーザのニーズを満たす。
【0016】
本発明の他の特徴及び利点は、添付の図面を参照する以下の実施形態の詳細な説明において明白になる。
【図面の簡単な説明】
【0017】
図1】本発明の言語データ処理システムの一実施形態が示されるブロック図である。
図2】本発明の言語データ処理方法の一実施形態が示されるフローチャートである。
【発明を実施するための形態】
【0018】
本明細書において、「結合」又は「接続」という用語は、複数の電気機器/装置/設備の間が導電材料(例えば、電線)により直接的に接続されること、或いは、2つの電気機器/装置/設備の間が他の一つ以上の機器/装置/設備又は無線通信により間接的に接続されることを意味する。
【0019】
図1を参照すると、本発明の言語データ処理システム1の一実施形態が示される。言語データ処理システム1は、ネットワークを介して、複数のユーザ側装置5に電気的に接続し、それぞれのユーザ側装置5と通信することができる。本明細書は、説明の便宜上、図1に示されるように、1つのユーザ側装置5と接続する言語データ処理システム1について説明する。
【0020】
ユーザ側装置5は、処理モジュール51と、処理モジュール51に電気的に接続する入力モジュール52と、処理モジュール51に電気的に接続する出力モジュール53と、を含む。ユーザ側装置5は、例えば、音声操作可能なサービス装置、モバイル電子装置(例えば、スマートフォン、タブレットコンピューター、またはノート型のコンピューター)、デスクトップコンピューター、またはインターネット対応のテレビであってもよいが、これらに限定されない。
【0021】
本明細書においては、宿泊施設の一客室に設置され、ユーザ(宿泊客)に使用される音声操作可能なサービス装置であるユーザ側装置5を例として説明する。ユーザ側装置5が音声操作可能なサービス装置である場合、処理モジュール51は、中央処理装置であり、入力モジュール52は、少なくとも処理モジュール51に電気的に接続するマイクロフォンを有し、出力モジュール53は、少なくとも処理モジュール53に電気的に接続するスピーカー及びディスプレイを有する。音声操作可能なサービス装置であるユーザ側装置5は、入力モジュール52のマイクロフォンを介して宿泊客の音声を拾い、出力モジュール53のスピーカーを介して対応の音声を出し、出力モジュール53のディスプレイを介して対応の情報を表示する。また、処理モジュール51は、無線通信(例えば、Wi-Fi(登録商標)、Bluetooth(登録商標))を介して、制御命令を出力することにより、客室内のエアコン、電話、テレビ、ライトなどの電子装置を操作する。
【0022】
本実施形態において、言語データ処理システム1は、サーバー装置であり、処理ユニット11と、処理ユニット11に電気的に接続する記憶ユニット12と、を含む。本実施形態において、処理ユニット11は、データ演算及び処理機能を有する中央処理装置であり、記憶ユニット12は、デジタルデータを格納するデータ記憶装置(例えば、ハードディスク)であるが、他の実施形態において、処理ユニット11は、複数の中央処理装置の組み合わせであってもよく、記憶ユニット12は、異なる種類のコンピュータ読み取り可能な記憶媒体(例えば、フラッシュメモリ)または複数の同種類または異なる種類のコンピュータ読み取り可能な記憶媒体の組み合わせであってもよく、本実施形態に制限されない。また、他の実施形態において、言語データ処理システム1は、スマートフォン、タブレットコンピューター、ノート型コンピューター、デスクトップコンピューターなどの電子装置であってもよく、または、互いに電気的に接続する複数のサーバー装置であってもよく、本実施形態に限定されない。
【0023】
本実施形態において、言語データ処理システム1の記憶ユニット12には、機械学習技術により実現され、処理ユニット11により使用される言語処理モデルMと、予め設定され、ユーザ側装置5を制御するように処理ユニット11により実行される複数の制御手順Pと、を含む。
【0024】
言語処理モデルMは、自然言語理解及び自然言語生成を実現するニューラルネットワークであり、言語処理モデルMは、予め設定される複数の意図タグLを含む。意図タグLのそれぞれは、ユーザ意図を示す意味特徴であり、すなわち、ユーザ意図を表す。具体的には、言語処理モデルMは、意図タグLが設定された後、少なくとも複数のフレーズデータをトレーニングデータとして機械学習によりトレーニングされたものである。フレーズデータのそれぞれは、自然言語で意図を表現するフレーズであり、例えば、「303号室に電話して」、「明日朝8時のアラームを設定して」、「テレビをつけて」などである。好ましくは、フレーズデータの一部は、自然言語で複数の意図を同時に表現するフレーズであり、例えば、「テレビとライトをつけて、エアコンもついでにつけて」、「音楽を消してから、501室に電話して」、「ジェイ・チョウの曲を流して、そして、明日のタイペイの天気を教えて」などであるが、これらに限定されない。トレーニングされた後、言語処理モデルMは、テキストデータに意図解析処理を実行することができ、意図タグLに基づいて、テキストデータからテキストデータが表す少なくとも1つのユーザ意図を解析する。
【0025】
言語処理モデルMが含む意図タグLについて、意図タグLのそれぞれが表す意味特徴は、ユーザ意図を表す。本実施形態において、言語データ処理システム1が接続するユーザ側装置5は宿泊施設の客室に設置される音声操作可能なサービス装置であるため、意図タグLは、客室内で発生することに関連し、例えば、「電話をかける」、「アラームを設定する」、「(家電の)電源を入れる」、「(家電の)電源を切る」、「情報を調べる」、「音楽を流す」などの意図を示すものである。なお、ユーザ側装置5が客室に設置されるサービス装置に限定されないため、意図タグLは、前述の例に限定されない。
【0026】
本実施形態において、意図タグLは、順序性を有し、意図タグLの順序は予め設定される。例えば、「(家電の)電源を入れる」を示す意図タグL及び「情報を調べる」を示す意図タグLは、「音楽を流す」を示す意図タグLより優先する。意図タグLに順序を設定することは、例えば、ユーザが、1つのフレーズで「(家電の)電源を入れる」、「情報を調べる」、及び「音楽を流す」の3つのユーザ意図を同時に表現した場合において、言語データ処理システム1が、「(家電の)電源を入れる」及び「情報を調べる」のユーザ意図に応えてから、「音楽を流す」のユーザ意図に応えることができるようになることを意味する。なお、意図タグLの順序は、それぞれのユーザに合わせて自由に設定し調整することができるため、その順序は本発明のポイントではなく、更なる説明をしない。
【0027】
また、本実施形態において、複数の意図タグLのうちの1つが、排他的な意図タグL’として設定される。排他的な意図タグL’が表すユーザ意図は、一番に応えられる、最優先のユーザ意図である。例えば、本実施形態において、排他的な意図タグL’は「電話をかける」のユーザ意図を示す意図タグLである。なお、意図タグLのいずれを排他的な意図タグL’に設定するかは、ニーズに応じて、自由に設定することができる。また、本実施形態に限定されず、排他的な意図タグL’として設定される意図タグLは複数であってもよく、複数の排他的な意図タグL’は順序性を有する。
【0028】
本実施形態において、記憶ユニット12に格納されている制御手順Pは、ネットワークを介してユーザ側装置5の処理モジュール51と通信する処理ユニット11が、ユーザ側装置5を制御するように用いられる。具体的には、本実施形態において、制御手順Pのそれぞれは、ユーザ側装置5を制御して特定のデータを特定な方法で出力するように用いられ、例えば、音声データを流し、文字データまたは画像データを表示し、無線通信を介して制御命令を客室内のエアコン、電話、テレビ、ライトなどの電子装置に出力しそれらの電子装置を操作する。さらに、本実施形態において、制御手順Pは、言語処理モデルMに含まれる意図タグLと対応する。具体的には、意図タグLのそれぞれが、制御手順Pのうちの少なくとも1つに対応する。例えば、「アラームを設定する」を示す意図タグLは、ユーザ側装置5自身のアラーム機能を設定するための制御手順Pに対応し、「電話をかける」を示す意図タグLは、ユーザ側装置5が、特定の相手に電話をかけるように電話に制御命令を送信する制御手順Pに対応する。
【0029】
図2を併せて参照し、以下では、言語データ処理システム1とユーザ側装置5の協働について、言語データ処理方法を説明する。
【0030】
ステップS1において、処理ユニット11が、音声入力に対応するテキストデータを得る。
【0031】
具体的には、本実施形態において、音声入力は、ユーザ側装置5の処理モジュール51が、入力モジュール52のマイクロフォンを介して得られたユーザの音声に対応する音声信号であり、すなわち、音声入力は、ユーザが喋ったフレーズを示す。音声入力を得ると、ユーザ側装置5の処理モジュール51は、該音声入力に対して音声認識処理を実行することにより該音声入力に対応するテキストデータを生成し、そして、該テキストデータを言語データ処理システム1に送信する。他の実施形態において、ユーザ側装置5の処理モジュール51は音声入力をそのまま言語データ処理システム1の処理ユニット11に送信し、処理ユニット11が、音声入力に対して音声認識処理を実行し、対応のテキストデータを生成する。従って、処理ユニット11がテキストデータを得る方法は、本実施形態に限定されない。
【0032】
ステップS2において、処理ユニット11が、記憶ユニット12から言語処理モデルMをロードし、該言語処理モデルMを用いて、テキストデータに意図解析処理を実行する。本実施形態において、意図解析処理を実行することにより、処理ユニット11は、テキストデータが表す複数の指定意図を得て、さらに、テキストデータに含まれる単語に基づいて、指定意図のそれぞれが明確な指定意図または曖昧な指定意図であるかを判断する。ここでの単語は、少なくとも1つの文字からなる。また、意図解析処理は意図タグLに基づいて実行するため、指定意図のそれぞれは、意図タグLのうちの1つに対応する。
【0033】
具体的には、処理ユニット11は、指定意図のそれぞれについて、該指定意図に意味的にマッチングし、対応の制御手順Pを実行できるようなキー単語が、テキストデータに含まれる単語にあるかどうかを判断する。キー単語があると判断される場合において、処理ユニット11は該指定意図が明確な指定意図であると判断し、そうでない場合は、処理ユニット11は該指定意図が曖昧な指定意図であると判断する。
【0034】
例えば、指定意図の1つが「電話をかける」を示す意図タグLに対応する場合において、処理ユニット11は、テキストデータに含まれる単語に、具体的な電話相手(例えば、宿泊施設内の部屋番号、特定の店、機構または電話番号)を示す単語があるかどうかを判断し、具体的な電話相手を示す単語がある場合において、処理ユニット11は、該単語をキー単語とすることにより、キー単語があると判断し、該指定意図が明確な指定意図であると判断し、そうでない場合において、処理ユニット11は、キー単語がないと判断し、該指定意図が曖昧な指定意図であると判断する。
【0035】
指定意図の1つが「アラームを設定する」を示す意図タグLに対応する場合において、処理ユニット11は、テキストデータに含まれる単語に、具体的なアラームを設定する時間(例えば、「朝8時」、「1時間後」など)を示す単語があるかどうかを判断し、具体的なアラームを設定する時間を示す単語がある場合において、処理ユニット11は、該単語をキー単語とすることにより、キー単語があると判断し、該指定意図が明確な指定意図であると判断し、そうでない場合において、処理ユニット11は、キー単語がないと判断し、該指定意図が曖昧な指定意図であると判断する。
【0036】
また、本実施形態において、意図タグLのそれぞれは、必要な情報特徴を含む。必要な情報特徴は、該意図タグLが表すユーザ意図の必要な情報を示す意味特徴である。例えば、「具体的な電話相手」は、「電話をかける」のユーザ意図の必要な情報であり、従って、「電話をかける」を示す意図タグLの必要な情報特徴は、「具体的な電話相手」を示す意味特徴である。言語処理モデルMを使用することにより、処理ユニット11は、指定意図のそれぞれが対応する意図タグLの必要な情報特徴に基づいて、必要な情報特徴にマッチングするキー単語がテキストデータにあるかどうかを判断し、ひいては、指定意図が明確な指定意図または曖昧な指定意図であるかを判断する。なお、他の実施形態において、明確な指定意図または曖昧な指定意図の判断は、機械学習によりトレーニングされた言語処理モデルMに実行させ、本実施形態に限定されない。
【0037】
ステップS3において、処理ユニット11は、指定意図のいずれかが曖昧な指定意図であるかどうかを判断する。すなわち、指定意図に曖昧な指定意図と判断される少なくとも1つの指定意図があるかどうかを判断する。処理ユニット11が、少なくとも1つの指定意図が曖昧な指定意図であると判断される場合において、ステップS4に進み、一方、指定意図のいずれも曖昧な指定意図ではないと判断される場合において、すなわち、曖昧な指定意図と判断される指定意図がない場合において、ステップS6に進む。
【0038】
ステップS4において、曖昧な指定意図であると判断される指定意図のうちの1つについて、処理ユニット11は、言語処理モデルを用いて、該指定意図に対応する質問メッセージを生成して、該質問メッセージをユーザ側装置5の処理モジュール51に送信し、出力モジュール53(スピーカー)に出力させる。質問メッセージは、ユーザに該指定意図について追加説明させるためのものである。例えば、曖昧な指定意図であると判断される該指定意図が「電話をかける」を示す意図タグLに対応する場合において、質問メッセージは「電話相手は誰ですか」であり、また、該指定意図が「アラームを設定する」を示す意図タグLに対応する場合において、質問メッセージは「アラームを何時に設定しますか」であるが、これらに限定されない。
【0039】
そして、ステップS5において、質問メッセージが出力された後の一定の応答期間(例えば、出力された後の5秒)内に、処理ユニット11が、該質問メッセージに関連し且つ他の音声入力に対応する追加のテキストデータを得ると、追加のテキストデータが該質問メッセージが対応する指定意図に意味的にマッチングするかどうかを判断し、且つ、該質問メッセージが対応する指定意図が対応する制御手順Pを追加のテキストデータに基づいて実行することができるかどうかを判断する。具体的には、処理ユニット11は、該指定意図に意味的にマッチングし、キー単語とすることができる単語が、追加のテキストデータに含まれる単語にあるかどうかを判断する。
【0040】
処理ユニット11が、追加のテキストデータが該指定意図に意味的にマッチングすると判断する場合において、該指定意図が明確な指定意図であると改めて判断する。すなわち、追加のテキストデータに含まれるキー単語に基づいて、該指定意図が明確な指定意図であると改めて判断する。一方、追加のテキストデータが該指定意図に意味的にマッチングしないと判断する場合において、処理ユニット11は、例えば、ユーザに指定意図について追加説明させるための他の質問メッセージをさらに生成し、ユーザ側装置5に送信して出力させる。同一の指定意図について質問メッセージを生成する回数が予め設定された所定の回数閾値に達しても、該指定意図が明確な指定意図であると改めて判断することができない場合において、処理ユニット11は、該指定意図について引き続き処理せず、該指定意図を無視(廃棄)する。
【0041】
例えば、曖昧な指定意図であると判断される該指定意図が「電話をかける」を示す意図タグLに対応し、且つ、質問メッセージの「電話相手は誰ですか」に関連する追加のテキストデータが「602号室に電話して」である場合において、処理ユニット11は、追加のテキストデータに含まれる「602号室」が該指定意図に意味的にマッチングすると判断し、該指定意図が明確な指定意図であると改めて判断する。また、該指定意図が「アラームを設定する」を示す意図タグLに対応し、且つ、質問メッセージの「アラームを何時に設定しますか」に関連する追加のテキストデータが「五時半に設定しよう」である場合において、処理ユニット11は、追加のテキストデータに含まれる「五時半」が指定意図に意味的にマッチングすると判断し、該指定意図が明確な指定意図であると改めて判断する。
【0042】
ステップS6において、処理ユニット11は、言語処理モデルMを用いて、明確な指定意図であると判断される指定意図について、背反処理及び排他処理を実行し、これにより、明確な指定意図であると判断される指定意図から少なくとも1つの目標の指定意図を決定する。本実施形態においては、背反処理を実行してから排他処理を実行するが、これに限定されない。
【0043】
本実施形態において、背反処理は、処理ユニット11が、言語処理モデルMを用いて、明確な指定意図であると判断される指定意図に、互いに背反する複数の指定意図があるかどうかを判断し、互いに背反する複数の指定意図があると判断される場合において、互いに背反する複数の指定意図を1つの背反意図グループとし、それぞれの背反意図グループから、候補の指定意図の1つとする1つの指定意図を選択し、選択された指定意図以外の指定意図を無視する。本実施形態において、処理ユニット11は、1つの背反意図グループ内の、テキストデータにおいて最初に表現される明確な指定意図を候補の指定意図とし、すなわち、その後に表現される明確な指定意図を無視するが、本実施形態に限定されない。
【0044】
なお、前述の「互いに背反する複数の指定意図」は、それらの指定意図が互いに意味的に矛盾すること、或いは、それらの指定意図が対応する制御手順Pが処理ユニット11により同時に実行することができないことを示す。指定意図が互いに意味的に矛盾することかどうかの判断は、言語処理モデルMの自然言語理解を用いて、実現することができる。同時に実行することができない制御手順Pは、予め設定される。例えば、制御手順Pにおいてユーザ側装置5に音声を出力させる複数の制御手順Pを、同時に実行することができない制御手順Pとして設定する。
【0045】
テキストデータが「音量を大きくして、音量を小さくして、音楽を止めて」である例について、処理ユニット11は、該テキストデータから、「音量を上げる」、「音量を下げる」、及び「音楽を停止する」の3つの互いに意味的に矛盾する明確な指定意図を解析し、テキストデータにおいて最初に表現される「音量を上げる」の明確な指定意図を候補の指定意図とし、その後に表現される「音量を下げる」及び「音楽を停止する」の2つの明確な指定意図を無視する。
【0046】
テキストデータが「ニュースと音楽を流して」である例について、処理ユニット11は、テキストデータから「ニュースを流す」及び「音楽を流す」の2つの明確な指定意図を解析する。該2つの明確な指定意図は、ユーザ側装置5に音声を出力させるものであるため、視聴体験を考慮すると、ユーザ側装置5にニュースと音楽を同時に流すことが不適切であり、すなわち、該2つの明確な指定意図それぞれが対応する制御手順Pを同時に実行することは適切ではない。従って、処理ユニット11は、「ニュースを流す」及び「音楽を流す」の2つの明確な指定意図が互いに背反すると判断し、該2つの明確な指定意図を1つの背反意図グループとし、該背反意図グループから最初に表現される「ニュースを流す」の明確な指定意図を候補の指定意図として選択し、その後に表現される「音楽を流す」の明確な指定意図を無視する。なお、本実施形態において、処理ユニット11は、いずれの背反意図グループにも属さない明確な指定意図があれば、それを、そのまま候補の指定意図とする。本実施形態において、背反意図グループのそれぞれについて、候補の指定意図とする指定意図を選択した後、排他処理を実行する。
【0047】
本実施形態において、排他処理は、処理ユニット11は、候補の指定意図とされる指定意図が対応する意図タグLに、排他的な意図タグL’である意図タグLが含まれるかどうかを判断し、排他的な意図タグL’である意図タグLが含まれると判断される場合において、該排他的な意図タグL’である意図タグLに対応する候補の指定意図とされる指定意図を唯一の目標の指定意図とし、その他の候補の指定意図とされる指定意図を無視し、そうでない場合において、すべての候補の指定意図とされる指定意図を目標の指定意図とする。例えば、排他的な意図タグL’が「電話をかける」を示す意図タグLであり、テキストデータが「フロントに電話して、ついでにテレビとエアコンをつけて」である場合において、処理ユニット11は、テキストデータから「電話をかける」、「テレビの電源を入れる」、及び「エアコンの電源を入れる」の3つの明確な指定意図を解析し、3つの明確な指定意図に対して排他処理を実行することにより、「電話をかける」の明確な指定意図を唯一の目標の指定意図とし、「テレビの電源を入れる」、及び「エアコンの電源を入れる」の2つの明確な指定意図を無視する。
【0048】
なお、他の実施形態において、ステップS6において、処理ユニット11は、明確な指定意図と判断される指定意図に、排他処理を実行せず、背反処理のみを実行してもよい。
【0049】
ステップS7において、処理ユニット11は、目標の指定意図それぞれが対応する意図タグLが対応する制御手順Pを実行する。本実施形態において、意図タグLが順序性を有するため、目標の指定意図が複数である場合において、処理ユニット11は、目標の指定意図が対応する意図タグLの順序に従って、対応の制御手順Pを1つずつ実行するが、本実施形態に限定されない。
【0050】
例えば、本実施形態において、テキストデータが「タイタニックのテーマソングをかけて、そして、明日の天気を調べて、あと、ライトもつけて」である場合において、処理ユニット11は、テキストデータから「音楽を流す」、「天気情報を調べる」及び「ライトの電源を入れる」の3つの目標の指定意図を決定し、そして、3つの目標の指定意図が対応する意図タグLの順序に従って、3つの目標の指定意図が対応する意図タグLが対応する制御手順Pを実行し、例えば、まず、「ライトの電源を入れる」の目標の指定意図が対応する制御手順Pを実行し、ユーザ側装置5の処理モジュール51を介して客室内のライトを制御して点灯し、それから、「天気情報を調べる」の目標の指定意図が対応する制御手順Pを実行し、ユーザ側装置5の出力モジュール53のディスプレイに天気情報を表示させ、最後に、「音楽を流す」の目標の指定意図が対応する制御手順Pを実行し、ユーザ側装置5の出力モジュール53のスピーカーにタイタニックのテーマソングの音楽ファイルを再生させる。
【0051】
目標の指定意図は、必ず明確な指定意図であることに留意されたい。本実施形態のステップS4及びS5は、曖昧な指定意図であると判断される指定意図のうちの1つについて処理(質問メッセージの生成など)して、該指定意図が明確な指定意図であると改めて判断しまたは該指定意図を無視する。本実施形態において、曖昧な指定意図であると判断される指定意図が1つ以上である場合は、処理ユニット11は、テキストデータで最初に表現される曖昧な指定意図のみについて処理し、その他の曖昧な指定意図を無視する。他の実施形態において、曖昧な指定意図が対応する意図タグLの順序に従って、順序が最優先の曖昧な指定意図について処理してもよい。いくつかの実施形態において、処理ユニット11は、ステップS4及びステップS5を複数回実行してもよく、例えば、曖昧な指定意図であると判断される指定意図のすべてについて処理し、または、その一部について処理してもよい(処理されない指定意図はそのまま無視する)。
【0052】
また、本実施形態のステップS1からステップS7及び図2のフローチャートは、本発明の言語データ処理方法を例示的に説明するものに過ぎなく、本発明を限定するものではない。ステップS1からステップS7を合併、分割、または順序調整しても、その技術的効果が本実施形態と同一であれば、本発明の範囲に含まれることに留意されたい。
【0053】
本発明のコンピュータープログラムは、前述の言語処理モデルMを含み、電子装置(例えば、スマートフォン、タブレットコンピューター、ノート型コンピューター、デスクトップコンピューターなど)により実行されると、電子装置が本発明の言語データ処理システム1となり、前述の言語データ処理方法を実行する。
【0054】
要約すると、本発明の言語データ処理システム1、言語データ処理方法、及びコンピュータープログラムは、テキストデータから指定意図を解析し、指定意図のそれぞれについて該指定意図が明確な指定意図または曖昧な指定意図であるかを判断し、明確な指定意図と判断される指定意図のみについて対応の制御手順Pを実行する。従って、テキストデータが表す一部の指定意図が明確でなくても(すなわち、曖昧な指定意図があっても)、言語データ処理システム1は、明確に表現された指定意図(すなわち、明確な指定意図)について、対応の手順を実行し、ユーザのニーズを満たす。また、曖昧な指定意図について、言語データ処理システム1は、ユーザに追加説明させるための質問メッセージを生成して出力することができる。さらに、ユーザが複数の互いに背反するニーズを1つのフレーズで表現しても、言語データ処理システム1は、背反処理を実行することにより対処し、そのうちの少なくとも1つのニーズに対応することができ、互いに意味的に矛盾するニーズにより動作しなくなることはない。これにより、言語データ処理システム1は、従来技術の短所を改善し、本発明の目的を確実に実現する。
【0055】
上記の説明では、説明の目的のために、実施形態の完全な理解を提供するために多数の特定の詳細が述べられた。しかしながら、当業者であれば、一又はそれ以上の他の実施形態が具体的な詳細を示さなくとも実施され得ることが明らかである。また、本明細書における「一実施形態」「一つの実施形態」を示す説明において、序数などの表示を伴う説明は全て、特定の態様、構造、特徴を有する本発明の具体的な実施に含まれ得るものであることと理解されたい。更に、本明細書において、時には複数の変化例が一つの実施形態、図面、又はこれらの説明に組み込まれているが、これは本明細書を合理化させるためのもので、本発明の多面性が理解されることを目的としたものであり、また、一実施形態における一又はそれ以上の特徴あるいは特定の具体例は、適切な場合には、本発明の実施において、他の実施形態における一またはそれ以上の特徴あるいは特定の具体例と共に実施され得る。
【0056】
以上、本発明の実施形態および変化例を説明したが、本発明はこれらに限定されるものではなく、最も広い解釈の精神および範囲内に含まれる様々な構成として、全ての修飾および均等な構成を包含するものとする。
【符号の説明】
【0057】
1 言語データ処理システム
11 処理ユニット
12 記憶ユニット
M 言語処理モデル
L 意図タグ
L’ 排他的な意図タグ
P 制御手順
5 ユーザ側装置
51 処理モジュール
52 入力モジュール
53 出力モジュール
S1-S7 ステップ
図1
図2