IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧 ▶ シャンハイ シャオドゥ テクノロジー カンパニー リミテッドの特許一覧

<>
  • 特許-情報を出力するための方法および装置 図1
  • 特許-情報を出力するための方法および装置 図2
  • 特許-情報を出力するための方法および装置 図3
  • 特許-情報を出力するための方法および装置 図4
  • 特許-情報を出力するための方法および装置 図5
  • 特許-情報を出力するための方法および装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-24
(45)【発行日】2022-04-01
(54)【発明の名称】情報を出力するための方法および装置
(51)【国際特許分類】
   G06F 16/90 20190101AFI20220325BHJP
   G06F 40/35 20200101ALI20220325BHJP
【FI】
G06F16/90 100
G06F40/35
【請求項の数】 13
【外国語出願】
(21)【出願番号】P 2020157689
(22)【出願日】2020-09-18
(65)【公開番号】P2021128745
(43)【公開日】2021-09-02
【審査請求日】2020-10-08
(31)【優先権主張番号】202010088113.7
(32)【優先日】2020-02-12
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際特許業務法人
(72)【発明者】
【氏名】ミャオ ヤーフェイ
(72)【発明者】
【氏名】ファ ウェンスン
(72)【発明者】
【氏名】シュ ビン
(72)【発明者】
【氏名】シエ ジエン
(72)【発明者】
【氏名】ジャン イーピン
(72)【発明者】
【氏名】ワン イエン
(72)【発明者】
【氏名】リュ ヨンイー
(72)【発明者】
【氏名】ワン チュ
【審査官】後藤 彰
(56)【参考文献】
【文献】特開2019-185716(JP,A)
【文献】特開2019-074843(JP,A)
【文献】特開2018-113064(JP,A)
【文献】特開2017-076403(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
情報を出力するための装置により実行される方法であって、
問題が受信されたことに応答して、前記問題に実体スロットが存在するか否かを検出するステップと、
前記問題に実体スロットが存在する場合、検出された実体スロットを候補スロットに追加するステップと、
前記問題における実体の限定的関係語を検出するステップと、
予め設定されたナレッジグラフにおいて前記候補スロットの周辺ナレッジグラフを検索するステップと、
前記限定的関係語に基づいて前記周辺ナレッジグラフを推定し、前記限定的関係語にマッチする実体語を出力するステップと、を含む方法
【請求項2】
前記方法は、
前記問題に実体スロットが存在しない場合、履歴対話から実体スロットを判断して候補スロットに追加するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記方法は、
前記候補スロットに指示代名詞が存在するか否かを検出するステップと、
前記候補スロットに指示代名詞が存在する場合、前記指示代名詞を最近の対話に出現した実体語に置き換えるステップと、をさらに含む、請求項1または2に記載の方法。
【請求項4】
前記指示代名詞を最近の対話に出現した実体語に置き換えるステップは、
最近の対話に出現した実体語の数が1つを超える場合、意味に応じて指示代名詞を置き換えるための実体語を見つけて置き換えるステップを含む、請求項3に記載の方法。
【請求項5】
前記方法は、
最近の対話に出現した実体語と前記限定的関係語に基づいて前記周辺ナレッジグラフを推定し、最近の対話に出現した実体語と前記限定的関係語にマッチする実体語を出力するステップをさらに含む、請求項3に記載の方法。
【請求項6】
問題が受信されたことに応答して、前記問題に実体スロットが存在するか否かを検出するように構成された実体検出ユニットと、
前記問題に実体スロットが存在する場合、検出された実体スロットを候補スロットに追加するように構成された追加ユニットと、
前記問題における実体の限定的関係語を検出するように構成された関係検出ユニットと、
予め設定されたナレッジグラフにおいて前記候補スロットの周辺ナレッジグラフを検索するように構成された検索ユニットと、
前記限定的関係語に基づいて前記周辺ナレッジグラフを推定し、前記限定的関係語にマッチする実体語を出力するように構成された推定ユニットと、を含む、情報を出力するための装置。
【請求項7】
前記追加ユニットはさらに、
前記問題に実体スロットが存在しない場合、履歴対話から実体スロットを判断して候補スロットに追加するように構成されている、請求項6に記載の装置。
【請求項8】
前記装置は、
前記候補スロットに指示代名詞が存在するか否かを検出し、存在する場合、前記指示代名詞を最近の対話に出現した実体語に置き換えるように構成された代名詞検出ユニットをさらに含む、請求項6または7に記載の装置。
【請求項9】
前記代名詞検出ユニットはさらに、
最近の対話に出現した実体語の数が1つを超える場合、意味に応じて指示代名詞を置き換えるための実体語を見つけて置き換えるように構成されている、請求項8に記載の装置。
【請求項10】
前記代名詞検出ユニットはさらに、
最近の対話に出現した実体語と前記限定的関係語に基づいて前記周辺ナレッジグラフを推定し、最近の対話に出現した実体語と前記限定的関係語にマッチする実体語を出力するように構成されている、請求項8に記載の装置。
【請求項11】
1つまたは複数のプロセッサと、1つまたは複数のプログラムが格納されている記憶装置と、を含む情報を出力するための電子機器であって、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1~5のいずれか1項に記載の方法を実施させる、情報を出力するための電子機器。
【請求項12】
コンピュータプログラムが格納されているコンピュータ可読媒体であって、
前記プログラムがプロセッサによって実行されると、請求項1~5のいずれか1項に記載の方法を実施する、コンピュータ可読媒体。
【請求項13】
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサにより実行されると、請求項1~5のいずれか一項に記載の方法を実現する、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、コンピュータ技術の分野に関し、特に、情報を出力するための方法および装置に関する。
【背景技術】
【0002】
スロット(Slot)認識とは、自然言語処理タスクにおける基礎タスクの1つ、すなわち自然言語の文から必要な単語や文節をマークすることである。「王菲が歌った私と私の祖国を聴きたい」を例にすると、「王菲」を歌手(Singer)と認識し、「私と私の祖国」を曲名(Song)と認識する。
【0003】
マンマシン対話の分野では、ユーザの記述はこのような規範的なものにならないことが多く、特に1つの文脈に関する対話シーンでは、ユーザが単語を省略したり、直前に出現した単語の断片を代名詞で置き換えたりする可能性がある。次のような例が挙げられる。
【0004】
例1:
Human(人):王菲が歌った私と私の祖国を聴きたい。
Robot:王菲が歌った歌である私と私の祖国を見つけました。どうぞ、ご鑑賞ください。
Human:彼女映画を観たい(slot 1:彼女、slot 2:映画)。
【0005】
例2:
Human:王菲が歌った私と私の祖国を聴きたい。
Robot:王菲が歌った歌である私と私の祖国を見つけました。どうぞ、ご鑑賞ください。
Human:バージョンを変えて聴きたい(slot 1:バージョンを変える)。
【0006】
従来のシーケンスラベリングでは、代名詞「彼女」、資源「映画」、行為「バージョンを変える」のみを表記することができるが、より豊かな意味を認識することはできない。バックエンドの垂直カテゴリ検索サービスでは、これらのスロットを手に入れて、簡単な資源検索を行うことはできない。
【0007】
既存の複数回スロット認識戦略は、基本的に以下の2種類の解決手段に分けられる。
【0008】
1.スロットのシーケンスラベリングを直接行い、照応解析や意味拡張を行わず、アプリケーション側はコードロジックやルールによってユーザの真のニーズを理解する。アプリケーション側は、これらのスロットを使用する際に、非常に複雑な組合せロジックまたはハードなマニュアルルールを作成することで資源を検索する。
【0009】
2.スロット認識時には、1つの対話ステートマシンを維持することによってマンマシンインタラクションのすべての対話を記録し、代名詞を前回の対話で認識されたスロットに置き換える。
【0010】
現在の複数回スロット認識技術の問題は主に汎用性、ロバスト性、保守性、拡張性などの面で不足していることに表れている。具体的には、以下の通りである。
【0011】
解決手段(1)は、考え方が比較的に直接的であり、照応関係のある単語を直接出力し、理解の責任を自然言語理解解析結果のアプリケーション側(通常は垂直カテゴリサービス)に任せるため、アプリケーション側の開発の難易度を大きく高めている。この解決手段を用いるシステム装置は、サブモジュール間のスロット命名インタフェースが非常に複雑になり、保守性が低くなる。
【0012】
解決手段(2)は、代名詞に対して一定の照応解析を行い、スロット命名複雑さを簡略化し、一部の名詞スロットの置換を解決することができるが、行為動詞や記述性、限定的な単語の解析能力は限られている。異なる垂直カテゴリに対して異なるステートマシンを作成してこのような問題を解決することしかできず、複雑さと開発コストが高まっている。
【発明の概要】
【0013】
本開示の実施形態は、情報を出力するための方法および装置を提案する。
【0014】
第1態様において、本開示の実施例は、問題が受信されたことに応答して、前記問題に実体スロットが存在するか否かを検出するステップと、問題に実体スロットが存在する場合、検出された実体スロットを候補スロットに追加するステップと、問題における実体の限定的関係語を検出するステップと、予め設定されたナレッジグラフにおいて候補スロットの周辺ナレッジグラフを検索するステップと、限定的関係語に基づいて前記周辺ナレッジグラフを推定し、限定的関係語にマッチする実体語を出力するステップと、を含む、情報を出力するための方法を提供する。
【0015】
いくつかの実施例において、該方法は、問題に実体スロットが存在しない場合、履歴対話から実体スロットを判断して候補スロットに追加するステップをさらに含む。
【0016】
いくつかの実施例において、該方法は、候補スロットに指示代名詞が存在するか否かを検出するステップと、候補スロットに指示代名詞が存在する場合、指示代名詞を最近の対話に出現した実体語に置き換えるステップと、をさらに含む。
【0017】
いくつかの実施例において、指示代名詞を最近の対話に出現した実体語に置き換えるステップは、最近の対話に出現した実体語の数が1つを超える場合、意味に応じて指示代名詞を置き換えるための実体語を見つけて置き換えるステップを含む。
【0018】
いくつかの実施例において、該方法は、最近の対話に出現した実体語と限定的関係語に基づいて周辺ナレッジグラフを推定し、最近の対話に出現した実体語と限定的関係語にマッチする実体語を出力するステップをさらに含む。
【0019】
第2態様において、本開示の実施例は、問題が受信されたことに応答して、前記問題に実体スロットが存在するか否かを検出するように構成された実体検出ユニットと、前記問題に実体スロットが存在する場合、検出された実体スロットを候補スロットに追加するように構成された追加ユニットと、前記問題における実体の限定的関係語を検出するように構成された関係検出ユニットと、予め設定されたナレッジグラフにおいて前記候補スロットの周辺ナレッジグラフを検索するように構成された検索ユニットと、前記限定的関係語に基づいて前記周辺ナレッジグラフを推定し、前記限定的関係語にマッチする実体語を出力するように構成された推定ユニットと、を含む、情報を出力するための装置を提供する。
【0020】
いくつかの実施例において、追加ユニットはさらに、問題に実体スロットが存在しない場合、履歴対話から実体スロットを判断して候補スロットに追加するように構成されている。
【0021】
いくつかの実施例において、該装置は、候補スロットに指示代名詞が存在するか否かを検出し、存在する場合、指示代名詞を最近の対話に出現した実体語に置き換えるように構成された代名詞検出ユニットをさらに含む。
【0022】
いくつかの実施例において、代名詞検出ユニットはさらに、最近の対話に出現した実体語の数が1つを超える場合、意味に応じて指示代名詞を置き換えるための実体語を見つけて置き換えるように構成されている。
【0023】
いくつかの実施例において、代名詞検出ユニットはさらに、最近の対話に出現した実体語と限定的関係語に基づいて周辺ナレッジグラフを推定し、最近の対話に出現した実体語と限定的関係語にマッチする実体語を出力するように構成されている。
【0024】
第3態様において、本開示の実施例は、1つまたは複数のプロセッサと、1つまたは複数のプログラムが格納されている記憶装置と、を含む情報を出力するための電子機器であって、前記1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに第1態様のいずれか1項に記載の方法を実施させる、情報を出力するための電子機器を提供する。
【0025】
第4態様において、本開示の実施例は、コンピュータプログラムが格納されているコンピュータ可読媒体であって、プログラムがプロセッサによって実行されると、第1態様のいずれか1項に記載の方法を実施する、コンピュータ可読媒体を提供する。
【0026】
第5態様において、本開示の実施例は、コンピュータプログラムであって、前記コンピュータプログラムがプロセッサにより実行されると、第1態様のいずれか1項に記載の方法を実現する、コンピュータプログラムを提供する。
【0027】
本開示の実施形態に係る情報を出力するための方法および装置によれば、本技術は複数回のマンマシン対話にナレッジグラフに基づく論理導出能力を導入しており、ユーザのquery(問題)の意図を区別することなく、グローバルに汎用的であり、メカニズムが柔軟であり、スロット認識能力を向上させるとともに、ユーザと対話ロボットとの対話回数および時間消費を著しく低減することができる。
【図面の簡単な説明】
【0028】
以下の図面を参照してなされた非限定的な実施形態に対する詳細な説明を読むことによって、本開示のその他の特徴、目的、および利点はより明らかになるであろう。
図1図1は本開示の一実施形態が適用可能な例示的なシステムアーキテクチャ図である。
図2図2は本開示に係る情報を出力するための方法の一実施形態のフローチャートである。
図3図3は本開示に係る情報を出力するための方法のナレッジグラフの概略図である。
図4図4は本開示に係る情報を出力するための方法の別の実施形態のフローチャートである。
図5図5は本開示に係る情報を出力するための装置の一実施形態の構成概略図である。
図6図6は本開示の実施形態の実施に適した電子機器のコンピュータシステムの構成概略図である。
【発明を実施するための形態】
【0029】
以下、本開示について、添付の図面および実施形態に関連してさらに詳細に説明する。本明細書に記載された特定の実施形態は、本発明の限定ではなく、関連する発明を説明するためにのみ使用されることを理解されたい。なお、説明を容易にするために、図面においては、関連発明に関連する部分のみが示されている。
【0030】
本開示における実施形態と実施形態における特徴は、衝突しない前提で相互に組み合わせられてもよいことに留意されたい。以下、本開示について図面を参照し、実施形態に関連して詳細に説明する。
【0031】
図1は、本開示の情報を出力するための方法または情報を出力するための装置の一実施形態が適用可能な例示的なシステムアーキテクチャ100を示す。
【0032】
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103、ネットワーク104、およびサーバ105を含むことができる。ネットワーク104は、端末装置101、102、103とサーバ105との間に通信リンクを提供するための媒体である。ネットワーク104は、有線、無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含むことができる。
【0033】
ユーザは、端末装置101、102、103を使用して、メッセージなどを受信または送信するために、ネットワーク104を介してサーバ105と対話することができる。端末装置101、102、103には、マンマシンインタラクション系アプリケーション、ウェブブラウザアプリケーション、ショッピング系アプリケーション、検索系アプリケーション、インスタント通信ツール、メールクライアント、ソーシャルプラットフォームソフトウェアなどの様々な通信クライアントアプリケーションがインストールされていてもよい。
【0034】
端末装置101、102、103は、ハードウェアであってもよいし、ソフトウェアであってもよい。端末装置101、102、103がハードウェアである場合には、マイクロフォンおよびスピーカを有し、マンマシン対話をサポートする様々な電子機器であってもよい。スマートフォン、タブレット、電子書籍リーダ、MP3プレーヤ(ムービングピクチャーエキスパートグループのオーディオレイヤー III)、MP4(ムービングピクチャーエキスパートグループのオーディオレイヤー IV) プレーヤ、ラップトップ、デスクトップコンピュータなどを含むが、これらに限定されない。端末装置101、102、103がソフトウェアである場合には、上述した電子機器にインストールすることができる。これは、(例えば、分散サービスを提供するために使用される)複数のソフトウェアまたはソフトウェアモジュールとして実施されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実施されてもよい。ここでは具体的な限定はしない。
【0035】
サーバ105は、端末装置101、102、103上で提示された質問に解答を提供するマンマシン対話サーバのような様々なサービスを提供するサーバであり得る。マンマシン対話サーバは、受信したマンマシン対話要求などのデータについて分析などの処理を行い、処理結果(例えば、解答)を端末装置にフィードバックすることができる。
【0036】
なお、サーバはハードウェアであってもよいし、ソフトウェアであってもよい。サーバがハードウェアである場合には、複数のサーバからなる分散サーバクラスタを実現することができ、単一のサーバとして実現することもできる。サーバがソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュール(例えば、分散サービスを提供するために使用される複数のソフトウェアまたはソフトウェアモジュール)として実施されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実施されてもよい。ここでは具体的な限定はしない。
【0037】
なお、本開示の実施形態に係る情報を出力するための方法は、一般にサーバ105によって実行され、それに応じて、情報を出力するための装置は、一般にサーバ105に配置される。
【0038】
図1の端末装置、ネットワーク、およびサーバの数は、概略的なものにすぎないことを理解されたい。実施の必要に応じて、任意の数の端末装置、ネットワーク、およびサーバを有することができる。
【0039】
引き続き図2を参照すると、図2は本開示に係る情報を出力するための方法の一実施形態のフローチャート200を示す。この情報を出力するための方法は、以下のステップ(ステップ201~206)を含む。
【0040】
ステップ201:問題が受信されたことに応答して、問題を検出する。
【0041】
本実施形態では、情報を出力するための方法の実行主体(例えば、図1に示すサーバ)は、ユーザが入力した問題を受信することができる。音声形式の問題であってもよいし、テキスト形式の問題であってもよい。音声形式の問題であれば、テキスト形式に変換する必要がある。そして、問題に実体スロットが存在するかどうかを検出する。実体スロットは、人または物品の名称、行為の動作、歌曲名などであり得る。問題を検出することは、スロットを認識することである。文法モデル、nm-crfモデル、マニュアルルールなどを含むがこれらに限定されない複数のスロット認識手法の組み合わせを用いることができる。
【0042】
ステップ202:実体スロットが存在する場合、検出された実体スロットを候補スロットに追加する。
【0043】
本実施形態では、現在の問題において実体スロットが直接検出された場合、後続の処理を行うために検出された実体スロットを候補スロットに追加する。例えば、マンマシン対話では、「王菲が歌った私と私の祖国を聴きたい」というHumanからの問題を受信した場合、「Singer:王菲、Song:私と私の祖国」が検出されることができる。
【0044】
ステップ203:実体スロットが存在しない場合、履歴対話から実体スロットを判断して候補スロットに追加する。
【0045】
本実施形態では、実体スロットがない場合、最大5回の履歴対話をさかのぼって、実体スロットがあるかどうかを調べることができる。実体スロットが見つかった場合は候補スロットに追加し、見つからなかった場合は通常のシナリオで行い、現在の認識結果を直接返す。
【0046】
ステップ204:問題における実体の限定的関係語を検出する。
【0047】
本実施形態では、限定的関係語は、「出演する」、「歌う」、「代弁する」、「妻」など、人と物、人と人、物と物との関係を限定する単語を含むことができる。
【0048】
ステップ205:予め設定されたナレッジグラフにおいて候補スロットの周辺ナレッジグラフを検索する。
【0049】
本実施形態では、ナレッジグラフ(Knowledge Graph)は、図書情報分野で知識域可視化や知識領域マッピングマップと呼ばれ、知識発展プロセスと構造関係を示す一連の様々な異なる図形であり、可視化技術を用いて知識資源とその担体を記述し、知識とそれらの相互関連を発掘、分析、構築、描画、表示する。周辺ナレッジグラフとは、コア実体語と密接に関連する局所グラフである。図3に示すように、実体スロットが「王菲」、「私と私の祖国」である周辺ナレッジグラフである。
【0050】
ステップ206:限定的関係語に基づいて周辺ナレッジグラフを推定し、限定的関係語にマッチする実体語を出力する。
【0051】
本実施形態では、周辺ナレッジグラフの範囲が大きいため、限定的関係語でさらに特定する必要がある。図3における限定的関係語が「バージョン」である。「王菲」には異なるバージョンがないが、「私と私の祖国」には王菲、李谷一、韓紅の3バージョンがある。前回の「王菲」バージョンが除外されると、「Singer:李谷一」または「Singer:韓紅」に戻ればいい。
【0052】
具体的な過程を以下の例に示す。
Human:王菲が歌った私と私の祖国を聴きたい。
Robot:王菲が歌った歌である私と私の祖国を見つけました。どうぞ、ご鑑賞ください。
Human:バージョンを変えて聴きたい。
【0053】
ユーザが「バージョンを変えて聴きたい」と言ったとき、前回の対話では、すでに「Singer:王菲、Song:私と私の祖国」というスロットを認識しており、今回の対話では、「play_action:change_version(バージョンを変える)」というスロットを認識する。本解決手段では、まず実体に基づいてナレッジグラフにおけるその位置と関係、すなわち「王菲-歌うバージョン-私と私の祖国」を検出する。そして、今回のスロットplay_actionに合わせて、「王菲」には異なるバージョンがないが、「私と私の祖国」には王菲、李谷一、韓紅の3バージョンがある。前回の「王菲」バージョンが除外されると、「Singer:李谷一」または「Singer:韓紅」に戻ればいい。
【0054】
本開示の上述した実施形態に係る方法では、ターゲットを絞って設計された汎用ナレッジグラフで、従来の解決手段における対話プロセスを維持するステートマシンを置き換える。本解決手段により、ナレッジグラフと推定戦略を整備するだけで、複数回の対話におけるスロット認識をより汎用的にすることができるとともに、垂直カテゴリを適用した解析負担を大幅に削減することができる。
【0055】
さらに図4を参照すると、情報を出力するための方法の別の実施形態のプロセス400が示されている。情報を出力するための方法のプロセス400は、以下のステップ(ステップ401~408)を含む。
【0056】
ステップ401:問題が受信されたことに応答して、問題を検出する。
【0057】
ステップ402:実体スロットが存在する場合、検出された実体スロットを候補スロットに追加する。
【0058】
ステップ403:実体スロットが存在しない場合、履歴対話から実体スロットを判断して候補スロットに追加する。
【0059】
ステップ404:問題における実体の限定的関係語を検出する。
【0060】
ステップ405:予め設定されたナレッジグラフにおいて候補スロットの周辺ナレッジグラフを検索する。
【0061】
ステップ401~405は、ステップ201~205と実質的に同じであるので、これ以上説明しない。
【0062】
ステップ406:候補スロットに指示代名詞が存在するか否かを検出する。
【0063】
本実施形態では、指示代名詞は名詞または1文に代わる品詞である。文法的意味の単語、例えば、私たち、自分、この、このような、そんなに、それらなどに加えて、先ほどの、前の、前方のなど、履歴対話から対応する実体を見つけることができる単語を含むことができる。例えば「バージョンを変える」とは、「王菲が歌った私と私の祖国」というバージョンを他のバージョンに変えることを指す。
【0064】
ステップ407:候補スロットに指示代名詞が存在する場合、指示代名詞を最近の対話に出現した実体語に置き換える。
【0065】
本実施形態では、マンマシン対話の分野において、ユーザの記述はこのような規範的なものにならないことが多く、特に1つの文脈に関する対話シーンでは、ユーザが単語を省略したり、前に出現した単語の断片を代名詞で置き換えたりする可能性がある。次のような例が挙げられる。
【0066】
例1:
Human:王菲が歌った私と私の祖国を聴きたい。
Robot:王菲が歌った歌である私と私の祖国を見つけました。どうぞ、ご鑑賞ください。
Human:彼女映画を観たい(slot 1:彼女、slot 2:映画)。
【0067】
例2:
Human:王菲が歌った私と私の祖国を聴きたい。
Robot:王菲が歌った歌である私と私の祖国を見つけました。どうぞ、ご鑑賞ください。
Human:バージョンを変えて聴きたい(slot 1:バージョンを変える)。
【0068】
本出願で提案する解決手段は、例1の3番目の文をスロット「Singer:王菲、source_type:映画」、例2の第3文をスロット「Singer:王菲、Song:私と私の祖国、play_action:change_version」と認識することができる。本解決手段で認識されるスロットは、ユーザが記述した文になく、戦略がナレッジグラフに基づいて導出されている。
【0069】
あるいは、最近の対話に出現した実体語の数が1つを超える場合、意味に応じて指示代名詞を置き換えるための実体語を見つけて置き換える。例えば、例1の第3文には指示代名詞「彼女」が出現し、最近の対話は第2文であり、出現した実体語は「王菲」、「私と私の祖国」である。ユーザがテキストで入力した場合、「彼女」によって、指示代名詞が指しているのが人間であることを確定することができるため、「王菲」を置き換えるために用いられる。ユーザが音声で入力した場合、指示代名詞が指しているのが人間であるかどうかは判断できない。しかし、「歌う」という限定的関係語に基づいて、「彼女」が人間を指していることが分かる。
【0070】
ステップ408:最近の対話に出現した実体語と限定的関係語に基づいて周辺ナレッジグラフを推定し、最近の対話に出現した実体語と限定的関係語にマッチする実体語を出力する。
【0071】
本実施形態では、例2に示すように、ユーザが「バージョンを変えて聴きたい」と言ったとき、前回の対話では、すでに「Singer:王菲、Song:私と私の祖国」というスロットを認識しており、今回の対話では、「play_action:change_version(バージョンを変える)」というスロットを認識する。本解決手段では、まず実体に基づいてナレッジグラフにおけるその位置と関係、すなわち「王菲-歌うバージョン-私と私の祖国」を検出する。そして、今回のスロットplay_action(バージョンを変える)に合わせて、「王菲」には異なるバージョンがないが、「私と私の祖国」には王菲、李谷一、韓紅の3バージョンがある。前回の「王菲」バージョンが除外されると、「Singer:李谷一」または「Singer:韓紅」に戻ればいい。
【0072】
図4から分かるように、本実施形態における情報を出力するための方法のプロセス400は、図2に対応する実施形態と比較して、指示代名詞を置き換えるステップを示している。これにより、本実施形態で説明した解決手段は、指示代名詞に対して一定の照応解析を行い、スロット命名複雑さを簡略化し、スロットの置き換えを解決することができるとともに、行為動詞や記述性、限定的な単語に対する解析能力を下げることはない。
【0073】
さらに図5を参照すると、本開示は、上述した各図に示す方法の実施として、情報を出力するための装置の一実施形態を提供する。この装置の実施形態は図2に示す方法の実施形態に対応しており、様々な電子機器に具体的に適用できる。
【0074】
図5に示すように、本実施形態に係る情報を出力するための装置500は、問題が受信されたことに応答して、問題に実体スロットが存在するか否かを検出するように構成された実体検出ユニット501と、実体スロットが存在する場合、検出された実体スロットを候補スロットに追加するように構成された追加ユニット502と、問題における実体の限定的関係語を検出するように構成された関係検出ユニット503と、予め設定されたナレッジグラフにおいて候補スロットの周辺ナレッジグラフを検索するように構成された検索ユニット504と、限定的関係語に基づいて周辺ナレッジグラフを推定し、限定的関係語にマッチする実体語を出力するように構成された推定ユニット505と、を含む。
【0075】
本実施形態では、情報を出力するための装置500における実体検出ユニット501、追加ユニット502、関係検出ユニット503、検索ユニット504、推定ユニット505の具体的な処理は、図2における対応実施形態のステップ201~205を参照することができる。
【0076】
本実施形態のいくつかのオプションの実施方法では、追加ユニット502はさらに、実体スロットが存在しない場合、履歴対話から実体スロットを判断して候補スロットに追加するように構成されている。
【0077】
本実施形態のいくつかのオプションの実施方法では、装置500は、候補スロットに指示代名詞が存在するか否かを検出し、存在する場合、指示代名詞を最近の対話に出現した実体語に置き換えるように構成された代名詞検出ユニット(図示せず)をさらに含む。
【0078】
本実施形態のいくつかのオプションの実施方法では、代名詞検出ユニットはさらに、最近の対話に出現した実体語の数が1つを超える場合、意味に応じて指示代名詞を置き換えるための実体語を見つけて置き換えるように構成されている。
【0079】
本実施形態のいくつかのオプションの実現方法では、代名詞検出ユニットはさらに、最近の対話に出現した実体語と限定的関係語に基づいて周辺ナレッジグラフを推定し、最近の対話に出現した実体語と限定的関係語にマッチする実体語を出力するように構成されている。
【0080】
図6を参照すると、本開示の実施形態の実施に適した電子機器(例えば、図1のサーバまたは端末装置)600の構成図が示されている。本開示の実施形態における端末装置は、携帯電話、ノートパソコン、デジタル放送受信機、PDA(パーソナルデジタルアシスタント)、PAD(タブレット)、PMP(携帯型マルチメディアプレーヤ)、車載端末(例えば、車載ナビゲーション端末)などの携帯端末、デジタルTV、デスクトップコンピュータなどの固定端末を含むことができるが、これらに限定されない。図6に示す端末装置/サーバは一例にすぎず、本開示の実施形態の機能および使用範囲に制限を与えるべきではない。
【0081】
図6に示すように、電子機器600は、読み取り専用メモリ(RОM)602に記憶されているプログラム、または記憶装置608からランダムアクセスメモリ(RAM)603にロードされたプログラムに応じて様々な適切な動作および処理を実行する処理装置(例えば、CPU、グラフィックスプロセッサなど)601を含むことができる。RAM 603には、電子機器600の動作に必要な各種のプログラムおよびデータも記憶されている。処理装置601、RОM602およびRAM603は、バス604を介して互いに接続されている。バス604には、入出力(I/O)インタフェース605も接続されている。
【0082】
一般に、タッチスクリーン、タッチパッド、キーボード、マウス、カメラ、マイク、加速度計、ジャイロスコープなどの入力装置606、液晶ディスプレイ(LCD)、スピーカ、振動子などの出力装置607、テープ、ハードディスクなどの記憶装置608、および通信装置609は、I/Oインタフェース605に接続することができる。通信デバイス609は、データを交換するために、電子機器600が他の装置と無線または有線通信を行うことを可能にすることができる。図6は、様々なデバイスを有する電子機器600を示しているが、図示した全ての装置を実施または備えることが要求されていないことを理解されたい。あるいは、より多くまたはより少ない装置を実施または備えることができる。図6に示す各ブロックは、1つのデバイスを表してもよく、必要に応じて複数のデバイスを表してもよい。
【0083】
特に、本開示の実施形態によれば、フローチャートを参照して上述したプロセスは、コンピュータソフトウェアプログラムとして実施されることが可能である。例えば、本開示の実施形態は、フローチャートに示された方法を実行するためのプログラムコードを含む、コンピュータ可読媒体上に担持されたコンピュータプログラム製品を含む。このような実施形態では、コンピュータプログラムは、通信装置609を介してネットワークからダウンロードされインストールされたり、記憶装置608からインストールされたり、RОM 602からインストールされたりすることができる。このコンピュータプログラムが処理装置601によって実行されると、本開示の実施形態の方法に限定された上記機能が実行される。なお、本開示の実施形態で説明したコンピュータ可読媒体は、コンピュータ可読信号媒体もしくはコンピュータ可読記憶媒体、または上記2つの任意の組合せであり得る。コンピュータ可読記憶媒体は、例えば、電気、磁気、光、電磁、赤外線、または半導体のシステム、装置もしくはデバイス、または以上の任意の組み合せであり得るが、これらに限られない。コンピュータ可読記憶媒体のより具体的な例は、1つまたは複数のリード線を有する電気的接続、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(RОM)、消去可能プログラマブル読取り専用メモリ(EPRОMまたはフラッシュメモリ)、光ファイバ、携帯型コンパクトディスク読取り専用メモリ(CD-RОM)、光記憶装置、磁気記憶装置、または上記の任意の適切な組み合せを含むが、これらに限られない。本開示の実施形態では、コンピュータ可読記憶媒体は、命令実行システム、装置またはデバイスによって使用されることもそれらに結合して使用されることも可能なプログラムを含むまたは記憶する任意の有形の媒体であり得る。本開示の実施形態では、コンピュータ可読信号媒体は、ベースバンド内においてまたはキャリアの一部として伝播された、コンピュータ可読プログラムコードを搬送しているデータ信号を含んでもよい。このような伝播されたデータ信号は、電磁信号、光信号、または上述の任意の適切な組み合せを含むが、これらに限られない様々な形態を採用することができる。コンピュータ可読信号媒体はまた、コンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよい。このコンピュータ可読信号媒体は、命令実行システム、装置またはデバイスによって使用されることもそれらに結合して使用されることも可能なプログラムを送信、伝播または伝送することができる。コンピュータ可読媒体に含まれているプログラムコードは、電線、光ケーブル、RF(無線周波数)など、または上記の任意の適切な組合せを含むが、これらに限られない任意の適切な媒体で伝送することができる。
【0084】
上記コンピュータ可読媒体は、上記電子機器に含まれるものであってもよく、個別に存在しており、該電子機器に組み込まれていないものであってもよい。上記コンピュータ可読媒体には、1つまたは複数のプログラムが記憶されており、上記1つまたは複数のプログラムがこの電子機器によって実行されると、この電子機器は、問題が受信されたことに応答して、問題に実体スロットが存在するか否かを検出するステップと、存在する場合、検出された実体スロットを候補スロットに追加するステップと、問題における実体の限定的関係語を検出するステップと、予め設定されたナレッジグラフにおいて候補スロットの周辺ナレッジグラフを検索するステップと、限定的関係語に基づいて周辺ナレッジグラフを推定し、限定的関係語にマッチする実体語を出力するステップと、を実行する。
【0085】
本出願の実施形態の動作を実行するためのコンピュータプログラムコードは、1つまたは複数のプログラミング言語、またはそれらの組み合せで書くことができる。プログラミング言語は、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語や、「C」言語または類似するプログラミング言語などの従来の手続き型プログラミング言語を含む。プログラムコードは、完全にユーザのコンピュータ上で実行されることも、部分的にユーザのコンピュータ上で実行されることも、スタンドアロンソフトウェアパッケージとして実行されることも、部分的にユーザのコンピュータ上で実行されながら部分的にリモートコンピュータ上で実行されることも、または完全にリモートコンピュータまたはサーバ上で実行されることも可能である。リモートコンピュータの場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができる。または、外部のコンピュータに接続されることができる(例えば、インターネットサービスプロバイダーによるインターネット経由で接続される)。
【0086】
図面におけるフローチャートおよびブロック図は、本開示の様々な実施形態に係るシステム、方法、およびコンピュータプログラム製品の実施可能なアーキテクチャ、機能、および動作を示している。ここで、フローチャートまたはブロック図における各ブロックは、モジュール、プログラムセグメント、またはコードの一部を表すことができる。該モジュール、プログラムセグメント、またはコードの一部は、指定されたロジック関数を実施するための1つまたは複数の実行可能な命令を含む。また、いくつかの代替的な実施形態では、ブロックに記載されている機能は、図面に示されているものとは異なる順序で発生する場合があることにも留意されたい。例えば、連続して表されている2つのブロックは、実際にほぼ並行して実行されてもよく、時には逆の順序で実行されてもよい。これは関連する機能によって決まる。また、ブロック図および/またはフローチャートにおける各ブロック、およびブロック図および/またはフローチャートにおけるブロックの組み合せは、指定された機能または動作を実行する専用のハードウェアベースのシステムで実施することも、または専用のハードウェアとコンピュータの命令の組み合せで実施することも可能であることに留意されたい。
【0087】
本開示の実施形態において説明されたユニットは、ソフトウェアまたはハードウェアによって実施され得る。説明されたユニットはプロセッサに内蔵されてもよい。例えば、「実体検出ユニットと、追加ユニットと、関係検出ユニットと、検索ユニットと、推定ユニットと、を含むプロセッサ」と説明することができる。なお、これらのユニットの名称は、場合によってはユニット自体を限定するものではない。例えば、実体検出ユニットは「問題が受信されたことに応答して、問題に実体スロットが存在するか否かを検出するユニット」として説明することもできる。
【0088】
上記の説明は、あくまでも本出願の好ましい実施形態および応用技術原理の説明にすぎない。本出願に係る発明の範囲は、上記の技術的特徴の特定の組み合わせによって形成された技術的解決手段に限定されず、上記の発明の構想から逸脱しない範囲で上記の技術的特徴またはその同等の技術的特徴の任意の組み合せによって形成されたその他の技術的解決手段、例えば、上記の特徴と本出願に開示された同様の機能を有する技術的特徴(それだけに限定されない)とが相互に代替することによって形成された技術的解決手段もカバーしていることを当業者は理解すべきである。
図1
図2
図3
図4
図5
図6