特表2024-515199 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 京▲東▼科技控股股▲フン▼有限公司の特許一覧

特表2024-515199要素テキスト処理方法、装置、電子機器及び記憶媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-04-05

(54)【発明の名称】要素テキスト処理方法、装置、電子機器及び記憶媒体

(51)【国際特許分類】

G06F 16/48 20190101AFI20240329BHJP

G06F 16/45 20190101ALI20240329BHJP

【ＦＩ】

G06F16/48

G06F16/45

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2023564414

(86)(22)【出願日】2022-04-13

(85)【翻訳文提出日】2023-10-20

(86)【国際出願番号】 CN2022086637

(87)【国際公開番号】W WO2022228127

(87)【国際公開日】2022-11-03

(31)【優先権主張番号】202110476637.8

(32)【優先日】2021-04-29

(33)【優先権主張国・地域又は機関】CN

(81)【指定国・地域】

(71)【出願人】

【識別番号】521507084

【氏名又は名称】京▲東▼科技控股股▲フン▼有限公司

(74)【代理人】

【識別番号】100118913

【弁理士】

【氏名又は名称】上田邦生

(74)【代理人】

【識別番号】100142789

【弁理士】

【氏名又は名称】柳順一郎

(74)【代理人】

【識別番号】100201466

【弁理士】

【氏名又は名称】竹内邦彦

(72)【発明者】

【氏名】リャン，ジアフイ

(72)【発明者】

【氏名】バオ，ジュンウェイ

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175DA01

5B175FA03

5B175FB01

(57)【要約】

本出願は、要素テキスト処理方法、装置、電子機器及び記憶媒体を開示する。ここで、この方法は、サンプルオブジェクトの複数の説明情報と要素タイプでマークされたサンプルの要約を取得するステップと、要素タイプの要素ベクトル特徴と各説明情報の説明ベクトル特徴を抽出するステップと、要素ベクトル特徴と説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、サンプルの要約を連合要約モデルの出力とするステップであって、連合要約モデルが第１のモデルと第２のモデルを含み、第１のモデルから出力された各説明情報と要素タイプとの間の関連度が第２のモデルの入力であり、さらに第１のモデルの分類損失値と第２のモデルの復号損失値とに基づいて連合要約モデルをトレーニングして、ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成するステップと、を含む。
【選択図】図１

【特許請求の範囲】

【請求項1】

サンプルオブジェクトの複数の説明情報、及び要素タイプでマークされたサンプルの要約を取得するステップと、
前記要素タイプの要素ベクトル特徴、及び各前記説明情報の説明ベクトル特徴を抽出するステップと、
前記要素ベクトル特徴と前記説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、前記サンプルの要約を前記連合要約モデルの出力とするステップであって、前記連合要約モデルが第１のモデルと第２のモデルを含み、前記第１のモデルから出力された各前記説明情報と前記要素タイプとの間の関連度が前記第２のモデルの入力であり、さらに前記第１のモデルの分類損失値と前記第２のモデルの復号損失値とに基づいて前記連合要約モデルをトレーニングして、ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成するステップと、
を含む要素テキスト処理方法。

【請求項2】

前記要素タイプでサンプルの要約をマークすることが、
複数のサンプルの要約に対してクラスタリング処理を行い、異なる要素タイプに属するサンプルの要約集合をマークすることを含む請求項１に記載の要素テキスト処理方法。

【請求項3】

前記要素タイプの要素ベクトル特徴、及び各前記説明情報の説明ベクトル特徴を抽出するステップが、
予め設定された語彙マッピングテーブルに基づいて前記要素タイプと各前記説明情報の文字列とを変換して、対応する要素タイプ数字番号と説明情報数字番号とを取得するステップと、
予め設定された埋め込み行列に基づいて前記要素タイプ数字番号と前記説明情報数字番号を処理して、要素ベクトル特徴及び各前記説明情報の説明ベクトル特徴を生成するステップと、
を含む請求項１に記載の要素テキスト処理方法。

【請求項4】

前記第１のモデルが、ＲＮＮ単語レベルエンコーダ、ＲＮＮ文レベルエンコーダ及び分類器を含み、
各前記説明情報の説明ベクトル特徴を前記ＲＮＮ単語レベルエンコーダに入力して符号化処理を行って、各単語の符号化された暗黙ベクトルを取得して平均化して各説明情報のベクトル表現として、
前記各説明情報のベクトル表現を前記ＲＮＮ文レベルエンコーダに入力して符号化処理を行って、圧縮して各前記説明情報の文レベル特徴数値ベクトルを取得し、
前記文レベル特徴数値ベクトルと前記要素ベクトル特徴を前記分類器に入力して、分類行列によって、各前記説明情報と前記要素タイプとの間の関連度を取得する請求項１に記載の要素テキスト処理方法。

【請求項5】

前記第２のモデルが、ＲＮＮエンコーダとＲＮＮデコーダを含み、
前記要素ベクトル特徴と前記説明ベクトル特徴とを加算して合成ベクトル特徴を取得して、前記合成ベクトル特徴を前記ＲＮＮエンコーダに入力して処理して、処理結果を前記ＲＮＮデコーダに入力し、前記第１のモデルから出力された各前記説明情報と前記要素タイプとの間の関連度が前記ＲＮＮデコーダの入力である請求項４に記載の要素テキスト処理方法。

【請求項6】

各前記説明情報と前記サンプルの要約との間の単語の重複率を計算するステップと、
前記単語の重複率と予め設定された重複率閾値とを比較して説明情報と要約との間の関連性を表すラベル行列を生成するステップと、
前記ラベル行列に基づいて前記第１のモデルの分類損失値を生成するステップと、
を含む請求項１に記載の要素テキスト処理方法。

【請求項7】

前記ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成するステップが、
ターゲットオブジェクトの商品説明情報を受信するステップと、
予め設定された少なくとも１つのターゲット要素タイプを取得するステップと、
前記商品説明情報と前記少なくとも１つのターゲット要素タイプをトレーニングされた連合要約モデルに入力して、各前記ターゲット要素タイプに対応する商品の要約を取得するステップと、
を含む請求項１から６のいずれか一項に記載の要素テキスト処理方法。

【請求項8】

サンプルオブジェクトの複数の説明情報、及び要素タイプでマークされたサンプルの要約を取得する第１の取得モジュールと、
前記要素タイプの要素ベクトル特徴、及び各前記説明情報の説明ベクトル特徴を抽出する抽出モジュールと、
前記要素ベクトル特徴と前記説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、前記サンプルの要約を前記連合要約モデルの出力とする第１の処理モジュールであって、前記連合要約モデルが第１のモデルと第２のモデルを含み、前記第１のモデルから出力された各前記説明情報と前記要素タイプとの間の関連度が前記第２のモデルの入力であり、さらに前記第１のモデルの分類損失値と前記第２のモデルの復号損失値とに基づいて前記連合要約モデルをトレーニングして、ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成する第１の処理モジュールと、
を備える要素テキスト処理装置。

【請求項9】

前記第１の取得モジュールが、
複数のサンプルの要約に対してクラスタリング処理を行い、異なる要素タイプに属するサンプルの要約集合をマークする請求項８に記載の要素テキスト処理装置。

【請求項10】

前記抽出モジュールが、
予め設定された語彙マッピングテーブルに基づいて前記要素タイプと各前記説明情報の文字列とを変換して、対応する要素タイプ数字番号と説明情報数字番号とを取得し、
予め設定された埋め込み行列に基づいて前記要素タイプ数字番号と前記説明情報数字番号を処理して、要素ベクトル特徴及び各前記説明情報の説明ベクトル特徴を生成する請求項８に記載の要素テキスト処理装置。

【請求項11】

前記第１の処理モジュールが、ＲＮＮ単語レベルエンコーダ、ＲＮＮ文レベルエンコーダ及び分類器を備え、
各前記説明情報の説明ベクトル特徴を前記ＲＮＮ単語レベルエンコーダに入力して符号化処理を行って、各単語の符号化された暗黙ベクトルを取得して平均化して各説明情報のベクトル表現として、
前記各説明情報のベクトル表現を前記ＲＮＮ文レベルエンコーダに入力して符号化処理を行って、圧縮して各前記説明情報の文レベル特徴数値ベクトルを取得し、
前記文レベル特徴数値ベクトルと前記要素ベクトル特徴を前記分類器に入力して、分類行列によって、各前記説明情報と前記要素タイプとの間の関連度を取得する請求項８に記載の要素テキスト処理装置。

【請求項12】

前記第１の処理モジュールが、ＲＮＮエンコーダとＲＮＮデコーダを備え、
前記要素ベクトル特徴と前記説明ベクトル特徴とを加算して合成ベクトル特徴を取得して、前記合成ベクトル特徴を前記ＲＮＮエンコーダに入力して処理して、処理結果を前記ＲＮＮデコーダに入力し、前記分類器から出力された各前記説明情報と前記要素タイプとの間の関連度が前記ＲＮＮデコーダの入力である請求項１１に記載の要素テキスト処理装置。

【請求項13】

各前記説明情報と前記サンプルの要約との間の単語の重複率を計算する計算モジュールと、
前記単語の重複率と予め設定された重複率閾値とを比較して説明情報と要約との間の関連性を表すラベル行列を生成する第１の生成モジュールと、
前記ラベル行列に基づいて前記第１のモデルの分類損失値を生成する第２の生成モジュールと、
を備える請求項８に記載の要素テキスト処理装置。

【請求項14】

前記第１の処理モジュールが、
ターゲットオブジェクトの商品説明情報を受信し、
予め設定された少なくとも１つのターゲット要素タイプを取得し、
前記商品説明情報と前記少なくとも１つのターゲット要素タイプをトレーニングされた連合要約モデルに入力して、各前記ターゲット要素タイプに対応する商品の要約を取得する請求項８から１３のいずれか一項に記載の要素テキスト処理装置。

【請求項15】

少なくとも１つのプロセッサと、
該少なくとも１つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記少なくとも１つのプロセッサが請求項１から７のいずれか一項に記載の方法を実行できるように、前記命令が、前記少なくとも１つのプロセッサによって実行される電子機器。

【請求項16】

コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令が、コンピュータに請求項１から７のいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。

【請求項17】

コンピュータプログラムが含まれるコンピュータプログラム製品であって、前記コンピュータプログラムがプロセッサによって実行される場合、請求項１から７のいずれか一項に記載の方法を実現するコンピュータプログラム製品。

【発明の詳細な説明】

【関連出願の相互参照】

【0001】

本出願は、中国特許出願番号が「２０２１１０４７６６３７．８」であり、出願日が２０２１年４月２９日である中国特許出願に基づいて提供され、当該中国特許出願の優先権を主張し、当該中国特許出願のすべての内容はここで参照として本出願に導入される。

【技術分野】

【0002】

本出願は、人工知能技術の分野における深層学習、自然言語処理技術の分野に関し、特に要素テキスト処理方法、装置、電子機器及び記憶媒体に関する。

【背景技術】

【0003】

テキスト要約技術は、所与の複数または単一の文書を要約し、元の文書の重要な内容を反映できることを確保するとともに、できるだけ簡潔かつ要領を得たテキスト要約を生成することができる。この技術は情報検索、自然言語処理などの分野で重要な研究課題である。

【発明の概要】

【0004】

本出願は、要素テキスト処理のための方法、装置、機器、記憶媒体、及びコンピュータプログラム製品を提供する。

【0005】

本出願の一態様によれば、要素テキスト処理方法を提供し、前記方法は、サンプルオブジェクトの複数の説明情報、及び要素タイプでマークされたサンプルの要約を取得するステップと、前記要素タイプの要素ベクトル特徴、及び各前記説明情報の説明ベクトル特徴を抽出するステップと、前記要素ベクトル特徴と前記説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、前記サンプルの要約を前記連合要約モデルの出力とするステップであって、前記連合要約モデルが第１のモデルと第２のモデルを含み、前記第１のモデルから出力された各前記説明情報と前記要素タイプとの間の関連度が前記第２のモデルの入力であり、さらに前記第１のモデルの分類損失値と前記第２のモデルの復号損失値とに基づいて前記連合要約モデルをトレーニングして、ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成するステップと、を含む。

【0006】

本出願の別の態様によれば、要素テキスト処理装置を提供し、前記装置は、サンプルオブジェクトの複数の説明情報、及び要素タイプでマークされたサンプルの要約を取得する第１の取得モジュールと、前記要素タイプの要素ベクトル特徴、及び各前記説明情報の説明ベクトル特徴を抽出する抽出モジュールと、前記要素ベクトル特徴と前記説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、前記サンプルの要約を前記連合要約モデルの出力とする第１の処理モジュールであって、前記連合要約モデルが第１のモデルと第２のモデルを含み、前記第１のモデルから出力された各前記説明情報と前記要素タイプとの間の関連度が前記第２のモデルの入力であり、さらに前記第１のモデルの分類損失値と前記第２のモデルの復号損失値とに基づいて前記連合要約モデルをトレーニングして、ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成する第１の処理モジュールと、を備える。

【0007】

本出願の第３様態によれば、電子機器を提供し、プロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を備え、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記少なくとも１つのプロセッサが本出願の第１の態様に記載の要素テキスト処理方法を実行できるように、前記命令は、前記少なくとも１つのプロセッサによって実行される。

【0008】

本出願の第４態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに本出願の第１の態様に記載の要素テキスト処理方法を実行させる。

【0009】

本出願の第５態様によれば、コンピュータプログラムが含まれるコンピュータプログラム製品を提供し、前記コンピュータプログラムはプロセッサによって実行される場合、第１の態様に記載の要素テキスト処理方法を実現する。

【0010】

なお、この部分に記載されている内容は、本出願の実施例の肝心または重要な特徴を特定することを意図しておらず、本出願の範囲を限定することも意図していないことを理解されたい。本出願の他の特徴は、以下の説明によって容易に理解される。

【図面の簡単な説明】

【0011】

図面は、本技術案をよりよく理解するために使用され、本開示を限定するものではない。

【図1】本出願の１つまたは複数の実施例に係る要素テキスト処理方法のフローチャートである。

【図2】本出願の１つまたは複数の実施例に係る要素テキスト処理方法のフローチャートである。

【図3】本出願の１つまたは複数の実施例に係る要素テキスト処理方法のフローチャートである。

【図4】本出願の１つまたは複数の実施例に係る単語の重複率の比較概略図である。

【図5】本出願の１つまたは複数の実施例に係る連合要約モデルの概略構成図である。

【図6】本出願の１つまたは複数の実施例に係る要素テキスト処理方法のフローチャートである。

【図7】本出願の１つまたは複数の実施例に係る要素テキスト処理装置の概略構成図である。

【図8】本出願の１つまたは複数の実施例に係る要素テキスト処理装置の概略構成図である。

【図9】本出願の１つまたは複数の実施例に係る要素テキスト処理装置の概略構成図である。

【図10】本出願の１つまたは複数の実施例に係る要素テキスト処理装置の概略構成図である。

【図11】本出願の１つまたは複数の実施例に係る要素テキスト処理方法を実現するための電子機器のブロック図である。

【発明を実施するための形態】

【0012】

以下、図面と組み合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

【0013】

図１は、本出願の実施例に係る要素テキスト処理方法のフローチャートである。

【0014】

図１に示すように、この要素テキスト処理方法はステップ１０１～１０３を含むことができる。

【0015】

ステップ１０１、サンプルオブジェクトの複数の説明情報、及び要素タイプでマークされたサンプルの要約を取得する。

【0016】

本出願のいくつかの実施例では、この連合要約モデルをトレーニングする場合、サンプルオブジェクトの複数の説明情報、及び要素タイプでマークされたサンプルの要約を取得する必要がある。サンプルオブジェクトは、商品、ニュースイベントなどの様々なアプリケーションシーンに基づいて選択することができる。

【0017】

通常、１つのサンプルオブジェクトは、少なくとも１つの説明情報に対応することができ、各説明情報は１つまたは複数の文で構成することができる。この説明情報は、このサンプルオブジェクトを異なる要素タイプの観点から説明することができるため、１つの説明情報と、異なる要素タイプとの間には異なる関連度がある。なお、この説明情報の言語スタイルは、概括的ではなく説明的であることが多い。

【0018】

この説明情報の取得方法は、具体的な応用シーンに基づいて選択することができ、以下の２つの方法を含むが、これらに限定されない。

【0019】

方法１、ウェブページからクローラ技術によってサンプルオブジェクトに関連する情報を説明情報としてクロールする。

【0020】

方法２、サンプルオブジェクトに関連する情報を説明情報として人為的に選び取る。

【0021】

説明情報とは異なり、サンプルオブジェクトに対応するサンプル要約は概括的であることが多く、１つのサンプルオブジェクトは複数の要素タイプに対応することができ、異なる要素タイプについては異なるサンプル要約があり得ることが理解することができる。例えば、サンプルオブジェクトがＡ携帯電話であり、要素タイプが外観である場合、対応するサンプルの要約は、一体化した金属ボディを採用し、肌触りが細かく、握り心地がよいことである。サンプルオブジェクトがＡ携帯電話であり、要素タイプが性能である場合、対応するサンプルの要約は、ａチップを採用し、スムーズに動作し、動作が遅いことがなく、性能がより強いことである。

【0022】

ここで、用要素タイプでサンプルの要約をマークする方法は具体的な応用シーンに基づいて選択することができ、以下の２つの方法を含むが、これらに限定されない。

【0023】

方法１、手動でマークすることによって、サンプルの要約を、対応する要素タイプにマークする。

【0024】

方法２、複数のサンプルの要約に対してクラスタリング処理を行い、異なる要素タイプに属するサンプルの要約集合をマークする。なお、クラスタリング処理の後に、複数のサンプルの要約集合を取得することができ、各サンプルの要約集合内のサンプルの要約が、同じ要素タイプに属すると理解することができ、同じ集合内のサンプルの要約を、同じ要素タイプにマークすることができる。ここで、用いられるクラスタリング処理方法は、Ｋ－ｍｅａｎｓ法、密度に基づくクラスタリング法のいずれかを含むが、これらに限定されない。

【0025】

ステップ１０２、要素タイプの要素ベクトル特徴、及び各説明情報の説明ベクトル特徴を抽出する。

【0026】

なお、現在の要素タイプと説明情報がテキスト情報であり、本出願のいくつかの実施例では、これらのテキスト情報を特徴抽出する必要がある。すなわち、要素タイプに対応する要素ベクトル特徴を抽出し、各説明情報に対応する説明ベクトル特徴を抽出する。上記２つのベクトル特徴の抽出方法は同じであってもよいし、異なってもよい。

【0027】

概して、ベクトル特徴の抽出方法は様々な方法があり、具体的な応用シーンに応じて選択することができ、Ｂａｇｓｏｆｗｏｒｄｓ，ＴＦ－ＩＤＦ（ｔｅｒｍｆｒｅｑｕｅｎｃｙ－ｉｎｖｅｒｓｅｄｏｃｕｍｅｎｔｆｒｅｑｕｅｎｃｙ）のいずれかを含むが、これらに限定されない。

【0028】

ステップ１０３、要素ベクトル特徴と説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、サンプルの要約を連合要約モデルの出力として、ここで、連合要約モデルが第１のモデルと第２のモデルを含み、第１のモデルから出力される各説明情報と要素タイプとの間の関連度が第２のモデルの入力であり、さらに第１のモデルの分類損失値と第２のモデルの復号損失値とに基づいて連合要約モデルをトレーニングして、ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成する。

【0029】

なお、トレーニングされた連合要約モデルは、入力された要素ベクトル特徴とオブジェクトの説明ベクトル特徴に基づいて、サンプルの要約を出力することができる。ここで、入力された要素ベクトルに対応する要素タイプはターゲット要素タイプと呼ぶことができ、このオブジェクトはターゲットオブジェクトと呼ぶことができ、出力されたサンプルの要約は商品の要約と呼ぶことができる。

【0030】

ここで、連合要約モデルは第１のモデルと第２のモデルとを含むことができ、本出願のいくつかの実施例では、第１のモデルは、少なくとも１つ、少なくとも１種類のニューラルネットワークモデルで構成される深層学習モデルであってもよい。応用シーンに応じて、リカレントニューラルネットワークモデル、畳み込みニューラルネットワークモデルなど、異なる構造の深層学習モデルを第１のモデルとして選択することができ、本出願では限定されない。第１のモデルのトレーニング方法も様々であり、例えば、説明ベクトル特徴と要素ベクトル特徴を入力として、説明ベクトル特徴に対応する説明情報と要素ベクトル特徴に対応する要素ベクトル特徴との間の関連度を出力として、対応する分類損失関数を設定して第１のモデルをトレーニングすることができ、前記分類損失関数が、負の対数尤度損失関数、二分類クロスエントロピー損失関数のいずれかを含むが、これらに限定されない。トレーニングされた第１のモデルは各説明情報と要素タイプとの間の関連度を出力することができる。

【0031】

第２のモデルは、少なくとも１つ、少なくとも１種類のニューラルネットワークモデルで構成される深層学習モデルであってもよい。応用シーンに応じて、シーケンスツーシーケンスモデル、畳み込みニューラルネットワークモデルなど、異なる構造の深層学習モデルを第２のモデルとして選択することができ、本出願では限定されない。第２のモデルの入力は、第１のモデルから出力された各説明情報と要素タイプとの間の関連度を含む。第２のモデルの入力は、要素ベクトルと説明ベクトルから生成されるベクトルをさらに含むことができる。第２のモデルのトレーニング方法も様々であってもよく、例えば、要素ベクトルと説明ベクトルから生成されるベクトルを入力として、ターゲット要素タイプにマッチングするテキスト要約を出力として、対応する復号損失関数を設定して第２のモデルをトレーニングすることができ、前記復号損失関数が、平均二乗偏差損失関数、平均絶対誤差損失関数のいずれかを含む。トレーニングされた第２のモデルはターゲット要素タイプにマッチングするテキスト要約を出力することができる。

【0032】

上記のように、連合要約モデルが第１のモデルと第２のモデルとを含む。従って、第１のモデルと第２のモデルの入力、出力、トレーニング過程は、連合要約モデルの入力、出力、トレーニング過程である。なお、要素ベクトル特徴と説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、サンプルの要約を連合要約モデルの出力として、第１のモデル的分類損失関数に対応する分類損失値と第２のモデルの復号損失関数に対応する復号損失値とに基づいて連合要約モデルをトレーニングすることができる。

【0033】

本出願の実施例の要素テキスト処理方法によれば、要素タイプ及びそれに対応する要素ベクトル特徴を取得し、説明情報及びそれに対応する説明ベクトル特徴を取得する。上記２種類のベクトル特徴を連合要約モデルの入力として、サンプルの要約を連合要約モデルの出力として、前記連合要約モデルをトレーニングする。トレーニングされた連合要約モデルは説明情報を処理し、テキスト要約を生成することができる。

【0034】

この方法は制御性が高く、応用シーンに応じて異なるレベルのターゲット要素タイプを設定し、異なるターゲット要素タイプに基づいてモデルを制御して異なるテキスト要約を生成させることができ、生成されたテキスト要約がターゲット要素タイプにマッチングする。この方法は抽出式要約技術ではなく、生成式要約技術に基づいているため、生成されたテキスト要約は可読性が高く、人間の言語習慣に合っている。

【0035】

本出願の実施例では、より正確なベクトル特徴を取得するために、語彙マッピングテーブル及び埋め込み行列を使用することができる。いくつかの実施例では、ステップ１０２はステップ２０１～２０２であってもよい。

【0036】

図２によってより明確に説明することができ、図２は本出願の実施例の要素テキスト処理方法のフローチャートである。

【0037】

ステップ２０１、予め設定された語彙マッピングテーブルに基づいて要素タイプと各説明情報の文字列とを変換して、対応する要素タイプ数字番号と説明情報数字番号とを取得する。

【0038】

本出願のいくつかの実施例では、単語を対応する数字番号に変換可能な語彙マッピングテーブルが存在してもよい。

【0039】

概して、説明情報は文字列で構成されており、説明情報に対して単語分割処理を行って、各説明情報に対応する複数の単語を取得することができる。語彙マッピングテーブルに基づいて、各説明情報の各単語を対応する説明情報数字番号に変換することができ、同様に、語彙マッピングテーブルに基づいて、要素タイプを対応する要素タイプ数字番号に変換することができる。

【0040】

ステップ２０２、予め設定された埋め込み行列に基づいて要素タイプ数字番号と説明情報数字番号とを処理して、要素ベクトル特徴及び各説明情報の説明ベクトル特徴を生成する。

【0041】

本出願のいくつかの実施例では、埋め込み行列を予め設定し、要素タイプ数字番号と説明情報番に基づいて、埋め込み行列から、対応する元素を選択して、対応するベクトル特徴を生成することができる。なお、要素タイプ数字番号に基づいて生成されたベクトル特徴は要素ベクトル特徴であり、説明情報数字番号に基づいて生成されたベクトル特徴は説明ベクトル特徴である。

【0042】

なお、予め設定された行列は複数であってもよく、要素埋め込み行列と説明埋め込み行列を予め設定することができる。要素タイプ数字番号に基づいて、要素埋め込み行列から、対応する元素を選択して、対応する要素ベクトル特徴を生成することができ、説明情報数字番号に基づいて、説明埋め込み行列から、対応する元素を選択し、対応する説明ベクトル特徴を生成することができる。

【0043】

本出願の実施例の要素テキスト処理方法によれば、語彙マッピングテーブル及び埋め込み行列を使用して、より正確で信頼性の高い特徴ベクトルを取得し、説明情報と要素タイプとの関連度計算をより正確にすることができる。最終的に生成されるテキスト要約は、ターゲット要素タイプとより密接に関係しており、制御性が高くなる。

【0044】

本出願の実施例では、説明情報と要素タイプとの間の関連度をより正確にするために、第１のモデルでは、ＲＮＮ（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ、リカレントニューラルネットワーク）単語レベルエンコーダ、ＲＮＮ文レベルエンコーダ及び分類器を設定し、テキスト要約をより正確にするように、第２のモデルでは、ＲＮＮエンコーダとＲＮＮデコーダとを設定する。いくつかの実施例では、第１のモデルのデータ処理フローはステップ３０１～３０３であり、第２のモデルのデータ処理フローはステップ３０４である。

【0045】

図３によってより明確に説明することができ、図３は、本出願の実施例に係る要素テキスト処理方法のフローチャートである。

【0046】

ステップ３０１、各説明情報の説明ベクトル特徴をＲＮＮ単語レベルエンコーダに入力して符号化処理を行って、各単語の符号化された暗黙ベクトルを取得して平均化して各説明情報のベクトル表現とする。

【0047】

なお、１つの説明情報が単語分割処理された後、複数の単語に対応することができる。ここで、各単語は、対応する説明ベクトル特徴を有することができる。本出願のいくつかの実施例では、各説明情報の説明ベクトル特徴をＲＮＮ単語レベルエンコーダに入力することができ、ここで、ＲＮＮ単語レベルエンコーダの構造は、応用シーンに応じて設計することができ、例えば、１つまたは複数の循環ニューロンが含まれるユニットであってもよく、本実施例では限定されない。

【0048】

ＲＮＮ単語レベルエンコーダにより、説明ベクトル特徴に対応する暗黙ベクトルを取得することができる。この暗黙ベクトルは、説明情報に対応する単語が処理された後、取得された暗黙ベクトルである。同じ説明情報に属する暗黙ベクトルを平均化すると、現在の説明情報に対応するベクトル表現を取得する。同様に、各説明情報に対応するベクトル表現を取得することができる。

【0049】

ステップ３０２、各説明情報のベクトル表現をＲＮＮ文レベルエンコーダに入力して符号化処理を行って、圧縮して各説明情報の文レベル特徴数値ベクトルを取得する。

【0050】

本出願のいくつかの実施例では、各説明情報に対応するベクトル表現をＲＮＮ文レベルエンコーダに入力することができ、ＲＮＮ文レベルエンコーダはこのベクトル表現を圧縮して、固定次元の数値ベクトルを取得し、この数値ベクトルは文レベル特徴数値ベクトルである。なお、各説明情報は１つの文レベル特徴数値ベクトルに対応する。

【0051】

ここで、ＲＮＮ文レベルエンコーダの構造は、応用シーンに応じて設計することができ、本実施例では限定されず、例えば、１つまたは複数の循環ニューロンが含まれるユニットであってもよい。

【0052】

ステップ３０３、文レベル特徴数値ベクトルと要素ベクトル特徴とを分類器に入力して、分類行列によって、各説明情報と要素タイプとの間の関連度を取得する。

【0053】

本出願のいくつかの実施例では、１つの分類器があってもよく、この分類器の入力は文レベル特徴数値ベクトルと要素ベクトル特徴である。この分類モデルには１つの分類行列がさらに存在可能であり、要素ベクトル特徴と各文レベル特徴数値ベクトルとをそれぞれ結合して同じ分類行列を通過することができる。この分類行列の元素はいくつかの予め設定されたパラメータであってもよい。

【0054】

この分類行列の出力は、Ｓｉｇｍｏｉｄ関数により、関連度を取得することができ、この関連度の値取り範囲は０～１である。関連度の大きさは各説明情報と現在要素タイプとの関連度合いを表し、説明情報と要素タイプとが関連するほど、関連度は１に近づき、逆には０に近づく。

【0055】

本出願のいくつかの実施例では、上記の実施例に基づいて、分類損失の計算を行うことがもきる。上記の実施例はステップ１～３をさらに含むことができる。

【0056】

ステップ１、各説明情報とサンプルの要約との間の単語の重複率を計算する。

【0057】

本出願のいくつかの実施例では、各説明情報とサンプルの要約とが重複している単語の数を計算することができ、重複している単語の数を説明情報の単語の総数で除算すると、説明情報とサンプル情報との間の単語の重複率を取得することができる。

【0058】

図４に示すように、図４は本出願の実施例に係る単語の重複率の比較概略図である。

【0059】

サンプルオブジェクトはＡ携帯電話であり、サンプルの要約と複数の説明情報は図４に示す。図から分かるように、このサンプルの要約の要素タイプは性能であり、この複数の説明情報の要素タイプは、写真撮影、性能の２種類を含む。単語の重複率を計算すると、文１～５の重複率は、０．４、０、０、０．４、０．１２５の順になる。

【0060】

ステップ２、単語の重複率と予め設定された重複率閾値とを比較して説明情報と要約との間の関連性を表すラベル行列を生成する。

【0061】

本出願のいくつかの実施例では、単語の重複率と比較可能な重複率閾値、を予め設定することができ、重複率閾値以上である説明情報は分類ラベル「１」を付与することができ、この閾値より小さいものは分類ラベル「０」を付与することができる。この分類ラベルは、説明情報と摘要との間の関連性を表し、ステップ３０３の分類行列に使用することができ、この分類ラベルはラベル行列と呼ぶことができる。

【0062】

図４に示すように、重複率閾値が０．３５である場合、文１～５に付与される分類ラベルはそれぞれ、１、０、０、１、０である。

【0063】

ステップ３、ラベル行列に基づいて第１のモデルの分類損失値を生成する。

【0064】

なお、ラベル行列に基づいて第１のモデルの分類損失値を生成し、勾配逆伝播によってモデル学習を行うことができる。

【0065】

ステップ１～ステップ３により、説明情報と摘要との間の関連性を正確かつ迅速に取得し、ラベル行列を生成することができる。このラベル行列によって生成される第１のモデル分類損失値により、第１のモデルが生成する関連度をより正確にすることができる。

【0066】

ステップ３０４、要素ベクトル特徴と説明ベクトル特徴とを加算して合成ベクトル特徴を取得し、合成ベクトル特徴をＲＮＮエンコーダに入力して処理し、処理結果をＲＮＮデコーダに入力し、ここで、第１のモデルから出力された各説明情報と要素タイプとの間の関連度がＲＮＮデコーダの入力である。

【0067】

本出願のいくつかの実施例では、要素ベクトル特徴と説明ベクトル特徴とを加算して、合成ベクトル特徴を取得し、合成ベクトル特徴をＲＮＮエンコーダに入力して処理し、ＲＮＮエンコーダで符号化すると、説明情報に対応するベクトル特徴を取得することができる。

【0068】

ＲＮＮエンコーダの処理結果をＲＮＮデコーダに入力し、ＲＮＮデコーダは各ステップの復号化時刻ごとに３つのパラメータを入力し、それぞれは、前時刻の隠れ状態、復号化して出力される対応する埋め込みベクトル、コンテキストベクトルである。ＲＮＮデコーダは、各ステップの復号化時刻に現在時刻の隠れ状態特徴を生成し、現在時刻のこの隠れ状態特徴は、ＲＮＮエンコーダの各出力と単語レベルの注意力重みを計算する。

【0069】

ＲＮＮデコーダの入力は、第１のモデルから出力された各説明情報と要素タイプとの間の関連度をさらに含み、この関連度は、説明情報に対応する文レベルの重みとして、説明情報に対応する各単語の単語レベルの注意力の重みに乗算されて再正規化され、すなわち、文レベルの注意力が対応する単語レベルの注意力に割り当てされ、更新された単語レベルの注意力が生成される。これによって、要素カテゴリとの関連度が高い文の単語の重みを増加させ、要素カテゴリとの関連度が低い文の単語の重みを下げる。

【0070】

更新された単語レベルの注意力とＲＮＮエンコーダの符号化出力とを重み付け加算すると、固定次元のコンテキストベクトルが取得され、ＲＮＮデコーダの入力の１つとして、ＲＮＮデコーダに、現在の要素カテゴリと一致する商品の要約出力のみを生成するように促す。

【0071】

ここで、ＲＮＮエンコーダとＲＮＮデコーダは、応用シーンに応じて設計することができ、例えば、１つまたは複数の循環ニューロンを含んでもよく、本実施例では限定されない。

【0072】

本出願のいくつかの実施例では、連合要約モデルの構造を図５に示すことができ、図５は本出願の実施例に係る連合要約モデルの概略構成図である。

【0073】

本出願の実施例では、説明情報と要素情報は埋め込み行列の処理を経て、それぞれ対応する説明ベクトル特徴と要素ベクトル特徴を取得する。連合要約モデルが第１のモデルと第２のモデルを含む。

【0074】

第１のモデルでは、説明ベクトル特徴はＲＮＮ単語レベルエンコーダの処理を経て、各単語の符号化された暗黙ベクトルを取得し、各説明情報の単語に対応する暗黙ベクトルを平均化して、各説明情報のベクトル表現を取得する。このベクトル表現をＲＮＮ文レベルエンコーダに入力して符号化処理を行って、圧縮して各説明情報の文レベル特徴数値ベクトルを取得する。文レベル特徴数値ベクトル、要素ベクトル特徴及びラベル行列を分類器に入力して、各説明情報と要素タイプとの間の関連度を取得する。

【0075】

第２のモデルでは、要素ベクトル特徴と説明ベクトル特徴とを加算して合成ベクトル特徴を取得し、ＲＮＮエンコーダに入力して処理する。処理結果と、第１のモデルで得られた関連度とをＲＮＮデコーダに入力して、サンプルの要約を取得する。

【0076】

本出願の実施例の要素テキスト処理方法によれば、第１のモデルでは、ＲＮＮ単語レベルエンコーダにより、ベクトル特徴の説明に基づいて、各単語の意味表現をさらに豊かにする。ＲＮＮ文レベルエンコーダにより、単語間、文間の情報交換と特徴モデリングが強化され、モデルに豊かな特徴表現を学習させる。

【0077】

第２のモデルでは、要素ベクトル特徴と説明ベクトル特徴とを加算することにより、各説明情報の単語と要素特徴との関連性を向上させる。第１のモデルで生成された関連度を入力することにより、要素カテゴリとの関連度が高い文の単語の重みを増加させ、要素カテゴリとの関連度が低い文の単語の重みを下げる。同時に、モデルの制御性を向上させる。

【0078】

本出願の実施例では、この連合要約モデルで商品の説明情報を処理して、対応する商品の要約を取得することができる。いくつかの実施例では、前記ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成するための具体的な実現形態はステップ６０１～６０３を含むことができる。

【0079】

図６によってより明確に説明することができ、図６は本出願の実施例に係る要素テキスト処理方法のフローチャートである。

【0080】

ステップ６０１、ターゲットオブジェクトの商品説明情報を受信する。

【0081】

なお、この連合要約モデルがトレーニングされた後、本出願の実施例の要素テキスト処理方法によれば、入力された商品説明情報及びターゲット要素タイプに対して、対応する商品の要約を出力することができる。

【0082】

本出願のいくつかの実施例では、ターゲットオブジェクトは、携帯電話、コンピュータなどの商品を含むが、これらに限定されない。この商品にはより詳細な説明情報があり、この商品説明情報には通常、複数の要素タイプの説明が含まれる。

【0083】

ステップ６０２、予め設定された少なくとも１つのターゲット要素タイプを取得する。

【0084】

本出願のいくつかの実施例では、商品の要約に対応する要素タイプであるターゲット要素タイプを予め設定することができる。

【0085】

ステップ６０３、商品説明情報と少なくとも１つのターゲット要素タイプとを、トレーニングされた連合要約モデルに入力して、各ターゲット要素タイプに対応する商品の要約を取得する。

【0086】

本出願のいくつかの実施例では、商品説明情報と少なくとも１つのターゲット要素タイプとを入力として、商品説明情報と少なくとも１つのターゲット要素タイプとをトレーニングされた連合要約モデルに入力することができ、この連合要約モデルが各ターゲット要素タイプに対応する商品の要約を出力することができる。

【0087】

本出願の実施例の要素テキスト処理方法によれば、取得されたターゲットオブジェクトの商品説明情報とターゲット要素タイプに基づいて、ターゲット要素タイプに関連する可読性の高い商品の要約を迅速かつ効率的に生成することができる。

【0088】

本出願の実施例によれば、本出願は要素テキスト処理装置をさらに提案する。

【0089】

図７は本出願の実施例に係る要素テキスト処理装置の構成ブロック図である。如図７に示すように、この要素テキスト処理装置７００は、第１の取得モジュール７１０、抽出モジュール７２０、第１の処理モジュール７３０を備えることができる。

【0090】

第１の取得モジュール７１０は、サンプルオブジェクトの複数の説明情報、及び要素タイプでマークされたサンプルの要約を取得し、抽出モジュール７２０は、要素タイプの要素ベクトル特徴、及び各説明情報の説明ベクトル特徴を抽出し、第１の処理モジュール７３０は、要素ベクトル特徴と説明ベクトル特徴をトレーニング対象の連合要約モデルの入力として、サンプルの要約を連合要約モデルの出力として、ここで、連合要約モデルが第１のモデルと第２のモデルを含み、第１のモデルから出力される各説明情報と要素タイプとの間の関連度が第２のモデルの入力であり、さらに第１のモデルの分類損失値と第２のモデルの復号損失値とに基づいて連合要約モデルをトレーニングして、ターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成する。

【0091】

本出願のいくつかの実施例では、図８に示すように、図８は本出願の実施例に係る要素テキスト処理装置の構成ブロック図であり、この要素テキスト処理装置８００では、第１の処理モジュール８３０は、ＲＮＮ単語レベルエンコーダ８３１、ＲＮＮ文レベルエンコーダ８３２、および分類器８３３を備え、ここで、各説明情報の説明ベクトル特徴をＲＮＮ単語レベルエンコーダに入力して符号化処理を行って、各単語の符号化された暗黙ベクトルを取得して平均化して各説明情報のベクトル表現として、各説明情報のベクトル表現をＲＮＮ文レベルエンコーダに入力して符号化処理を行って、圧縮して各説明情報の文レベル特徴数値ベクトルを取得し、文レベル特徴数値ベクトルと要素ベクトル特徴とを分類器に入力して、分類行列によって、各説明情報と要素タイプとの間の関連度を取得する。

【0092】

ここで、図８の８１０、８２０と図７の７１０、７２０は同じ機能と構造を有する。

【0093】

本出願のいくつかの実施例では、図９に示すように、図９は本出願の実施例に係る要素テキスト処理装置の構成ブロック図であり、この要素テキスト処理装置９００では、第１の処理モジュール９３０は、ＲＮＮエンコーダ９３４、およびＲＮＮデコーダ９３５をさらに備え、ここで、要素ベクトル特徴と説明ベクトル特徴とを加算して合成ベクトル特徴を取得し、合成ベクトル特徴をＲＮＮエンコーダに入力して処理し、処理結果をＲＮＮデコーダに入力し、ここで、分類器から出力された各説明情報と要素タイプとの間の関連度がＲＮＮデコーダの入力である。

【0094】

ここで、図９の９１０、９２０と図８の８１０、８２０、図９の９３１～９３３と図８の８３１～８３３は同じ機能と構造を有する。

【0095】

本出願のいくつかの実施例では、図１０に示すように、図１０は本出願の実施例に係る要素テキスト処理装置の構成ブロック図であり、この要素テキスト処理装置１０００は、計算モジュール１０４０、第１の生成モジュール１０５０、第２の生成モジュール１０６０をさらに備え、ここで、計算モジュール１０４０は、各説明情報とサンプルの要約との間の単語の重複率を計算し、第１の生成モジュール１０５０は、単語の重複率と予め設定された重複率閾値とを比較して説明情報と要約との間の関連性を表すラベル行列を生成し、第２の生成モジュール１０６０は、ラベル行列に基づいて第１のモデルの分類損失値を生成する。

【0096】

ここで、図１０の１０１０～１０３０と図９の９１０～９３０は同じ機能と構造を有する。

【0097】

本出願のいくつかの実施例では、第１の処理モジュール７３０がターゲットオブジェクトの商品説明情報を処理してターゲット要素タイプにマッチングする商品の要約を生成する具体的な実現過程は以下の通りである。ターゲットオブジェクトの商品説明情報を受信し、予め設定された少なくとも１つのターゲット要素タイプを取得し、商品説明情報と少なくとも１つのターゲット要素タイプをトレーニングされた連合要約モデルに入力して、各ターゲット要素タイプに対応する商品の要約を取得する。

【0098】

上記実施例の装置について、その各モジュールの操作を実行する具体的な方式は、この方法に関する実施例においてすでに詳細に説明したが、ここでは詳細に説明しない。

【0099】

本出願の実施例によれば、本出願は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム製品をさらに提供する。

【0100】

図１１は、本出願の実施例を実行するための例示的な電子機器１１００の概略ブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、および他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、および他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は、単なる例であり、本明細書の説明及び／又は要求される本出願の実現を制限することを意図したものではない。

【0101】

図１１に示すように、電子機器１１００は、読み取り専用メモリ（ＲＯＭ）１１０２に記憶されているコンピュータプログラムまたは記憶ユニット１１０８からランダムアクセスメモリ（ＲＡＭ）１１０３にロードされたコンピュータプログラムに従って様々な適切な動作および処理を実行できる計算ユニット１１０１を備える。ＲＡＭ１１０３には、電子機器１１００の動作に必要な各種のプログラムやデータも記憶されてもよい。計算ユニット１１０１、ＲＯＭ１１０２、およびＲＡＭ１１０３は、バス１１０４を介して互いに接続されている。バス１１０４には、入力／出力（Ｉ／Ｏ）インターフェース１１０５も接続されている。

【0102】

電子機器１１００の複数のコンポーネントはＩ／Ｏインターフェース１１０５に接続され、キーボード、マウスなどの入力ユニット１１０６、各タイプのディスプレイ、スピーカなどの出力ユニット１１０７、磁気ディスク、光ディスクなどの記憶ユニット１１０８、およびネットワークカード、モデム、無線通信トランシーバなどの通信ユニット１１０９を備える。通信ユニット１１０９は、電子機器１１００が、インターネットなどのコンピュータネットワークおよび／または各種の電信ネットワークを介して他のデバイスと情報／データを交換することを可能にする。

【0103】

計算ユニット１１０１は、処理および計算能力を有する様々な汎用および／または専用の処理コンポーネントであってもよい。計算ユニット１１０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、各種の専用の人工知能（ＡＩ）計算チップ、各種のマシン運転学習モデルアルゴリズムの計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、およびいずれかの適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット１１０１は、上記に記載された各方法及び処理、例えば、要素テキスト処理方法を実行する。例えば、いくつかの実施例では、要素テキスト処理方法を、記憶ユニット１１０８などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部または全部は、ＲＯＭ１１０２および／または通信ユニット１１０９を介して電子機器１１００にロードおよび／またはインストールすることができる。コンピュータプログラムがＲＡＭ１１０３にロードされ、計算ユニット１１０１によって実行される場合、前文に記載された要素テキスト処理方法の１つの或複数のステップが実行されてもよい。代替的に、他の実施例では、計算ユニット１１０１は要素テキスト処理方法を実行するように、他のいずれかの適切な方式（例えば、ファームウェアを介して）によって配置されてもよい。

【0104】

本明細書で上記記載のシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックス・プログラマブル・ロジック・デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、および／またはそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを備えるプログラム可能なシステムで実行および／または解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、および少なくとも１つの出力装置からデータおよび命令を受信し、データおよび命令を当該ストレージシステム、当該少なくとも１つの入力装置、および当該少なくとも１つの出力装置に伝送することができる。

【0105】

本出願の方法を実行するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせで書くことができる。これらのプログラムコードは、プロセッサ又はコントローラによって実行された際に、フローチャートおよび／またはブロック図に規定された機能／操作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよい。プログラムコードは、完全に機械上で実行されるか、部分的に機械上で実行されるか、スタンドアロンソフトウェアパッケージとして、部分的に機械上で実行され、部分的にリモート機械上で実行され又は完全にリモート機械又はサーバ上で実行されてもよい。

【0106】

本出願のコンテクストでは、機械読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって使用されるために、又は命令実行システム、装置、またはデバイスと組み合わせて使用するためのプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体システム、装置又はデバイス、または上記コンテンツの任意の適切な組み合わせを含むことができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、１つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリーメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、または上記コンテンツの任意の適切な組み合わせを含む。

【0107】

ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されるシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、ビジョンフィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力、または、触覚入力とを含む）でユーザからの入力を受信することができる。

【0108】

ここで説明されるシステムおよび技術は、バックエンドコンポーネントを備えるコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを備えるコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを備えるコンピューティングシステム（例えば、グラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインターフェース又は当該ウェブブラウザによってここで説明されるシステムおよび技術の実施形態とインタラクションできる）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントのいずれかの組み合わせを備えるコンピューティングシステムで実行することができる。任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークを含む。

【0109】

コンピュータシステムは、クライアントとサーバを備えることができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける１つのホスト製品であり、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」，または「ＶＰＳ」と省略する）に存在する管理の難しさ、ビジネス拡張性の弱いという欠陥を解決した。サーバは分散システムのサーバであってもよく、ブロックチェーンを組み込んだサーバであってもよい。

【0110】

【0111】

この方法は制御性が高く、応用シーンに応じて異なるレベルのターゲット要素タイプを設定し、異なるターゲット要素タイプに基づいてモデルを制御して異なるテキスト要約を生成させることができ、生成されたテキスト要約がターゲット要素タイプにマッチングする。この方法は抽出式要約技術ではなく、生成式要約技術に基いているため、生成されたテキスト要約は可読性が高く、人間の言語習慣に合っている。

【0112】

語彙マッピングテーブル及び埋め込み行列を使用して、より正確で信頼性の高い特徴ベクトルを取得し、説明情報と要素タイプとの関連度計算をより正確にすることができる。最終的に生成されるテキスト要約は、ターゲット要素タイプとの関連性が高く、制御性が高くなる。

【0113】

第１のモデルでは、ＲＮＮ単語レベル符号化層を介して、説明ベクトル特徴に基づいて各単語の意味表現をさらに豊かにする。ＲＮＮ文レベル符号化層を介して、単語間、文間の情報交換と特徴モデリングを強化し、モデルに豊かな特徴表現を学習させる。

【0114】

第２のモデルでは、要素ベクトル特徴と説明ベクトル特徴とを加算することにより、各説明情報の単語と要素特徴との関連性を向上させる。第１のモデルによって生成された関連度を入力することにより、要素カテゴリとの関連度が高い文の単語の重みを増加させ、要素カテゴリとの関連度が低い文の単語の重みを下げる。同時に、モデルの制御性を向上させる。

【0115】

【0116】

なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができると理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。

【0117】

上記具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本出願の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれるべきである。

【図1】