(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-29
(54)【発明の名称】情報生成方法、装置、電子機器及びコンピュータ可読媒体
(51)【国際特許分類】
G06F 16/28 20190101AFI20240221BHJP
【FI】
G06F16/28
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023550238
(86)(22)【出願日】2021-12-21
(85)【翻訳文提出日】2023-08-21
(86)【国際出願番号】 CN2021140219
(87)【国際公開番号】W WO2022174669
(87)【国際公開日】2022-08-25
(31)【優先権主張番号】202110188846.2
(32)【優先日】2021-02-19
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】522442928
【氏名又は名称】北京沃東天駿信息技術有限公司
【氏名又は名称原語表記】BEIJING WODONG TIANJUN INFORMATION TECHNOLOGY CO., LTD.
【住所又は居所原語表記】ROOM A402, 4/F, NO. 2 BUILDING, NO.18 KECHUANG 11TH STREET, ECONOMIC AND TECHNOLOGICAL DEVELOPMENT ZONE, BEIJING 100176, PEOPLE’S REPUBLIC OF CHINA
(71)【出願人】
【識別番号】517241916
【氏名又は名称】北京京東世紀貿易有限公司
【氏名又は名称原語表記】BEIJING JINGDONG CENTURY TRADING CO., LTD.
【住所又は居所原語表記】Room 201, 2/F, Block C, No.18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Beijing 100176, China
(74)【代理人】
【識別番号】110002262
【氏名又は名称】TRY国際弁理士法人
(72)【発明者】
【氏名】梁 嘉輝
(72)【発明者】
【氏名】鮑 軍威
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175KA12
(57)【要約】
情報生成方法、装置、電子機器及びコンピュータ可読媒体を提供する。当該情報生成方法は、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得すること(401)と、当該シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得ること(402)と、当該単語セットにおけるターゲット単語と当該グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成すること(403)と、構造化されたテキストデータとマッチング後のグラフモデルに基づき、融合後のグラフモデルを生成すること(404)と、当該融合後のグラフモデルに基づき、当該ターゲットアイテムの要約情報を生成すること(405)とを含む。当該方法は、シリアル化されたテキストデータ及び構造化されたテキストデータの特徴情報を考慮することにより、ターゲットアイテムの要約情報を正確且つ効果的に生成することができる。
【特許請求の範囲】
【請求項1】
情報生成の方法であって、
予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得し、前記グラフモデルが前記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ内容情報との関連関係を表し、前記グラフモデルにおけるノードが前記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、前記グラフモデルにおけるエッジに対応する数値が前記パラメータ名称と前記パラメータ内容情報との関連度合い情報を表すことと、
前記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得ることと、
前記単語セットにおけるターゲット単語と前記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成することと、
前記構造化されたテキストデータと前記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成することと、
前記融合後のグラフモデルに基づき、前記ターゲットアイテムの要約情報を生成することとを含む、ことを特徴とする方法。
【請求項2】
前記単語セットにおけるターゲット単語と前記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成することは、
前記単語セットにおけるターゲット単語と前記グラフモデルにおけるパラメータ名称とをマッチングし、マッチング結果を得ることと、
前記マッチング結果と前記グラフモデルにおけるターゲットエッジとに基づき、マッチング後のグラフモデルを生成し、前記ターゲットエッジが、前記グラフモデルにおいて前記ターゲット単語と前記ターゲット単語に対応するパラメータ名称との関連度合い情報を表すエッジであることとを含む、ことを特徴とする請求項1に記載の方法。
【請求項3】
前記融合後のグラフモデルに基づき、前記ターゲットアイテムの要約情報を生成することは、
前記融合後のグラフモデルを対応するベクトル行列に変換することと、
前記融合後のグラフモデルにおける各ノードに対応するベクトルを特定し、前記各ノードに対応するベクトルが前記パラメータ名称又は前記パラメータ内容情報の特徴情報を表すことと、
前記ベクトル行列と前記各ノードに対応するベクトルに基づき、前記ターゲットアイテムの要約情報を生成することとを含む、ことを特徴とする請求項1又は2に記載の方法。
【請求項4】
前記ベクトル行列と前記各ノードに対応するベクトルに基づき、前記ターゲットアイテムの要約情報を生成することは、
前記ベクトル行列と前記融合後のグラフモデルにおける各ノードに対応するベクトルを予め訓練されたグラフ畳み込みニューラルネットワークに入力し、第1出力結果を得ることと、
前記第1出力結果をコーディングし、第2出力結果を得ることと、
前記第2出力結果をデコーディングし、前記ターゲットアイテムの要約情報を得ることとを含む、ことを特徴とする請求項3に記載の方法。
【請求項5】
前記第1出力結果をコーディングし、第2出力結果を得ることは、
前記第1出力結果を予め訓練され、時系列テキストデータを処理するコーディングネットワークに入力し、前記第2出力結果を得ることを含む、ことを特徴とする請求項4に記載の方法。
【請求項6】
前記第2出力結果をデコーディングし、前記ターゲットアイテムに対応する要約情報を得ることは、
前記第2出力結果を予め訓練されて、時系列テキストデータを処理するデコーディングネットワークに入力し、前記ターゲットアイテムの要約情報を得ることを含む、ことを特徴とする請求項4又は5に記載の方法。
【請求項7】
前記グラフモデルにおけるエッジに対応する数値は、以下のステップにより特定され、
前記ターゲットアイテムのカテゴリにおける各アイテムのアイテム情報を取得し、前記アイテム情報がパラメータ名称と少なくとも1つのパラメータ数値を含み、前記各アイテムのアイテム情報に基づき、各パラメータ名称に対応する各パラメータ内容情報及び各パラメータ内容情報が前記各アイテムのアイテム情報に現れる回数を特定し、前記各パラメータ名称に対応する各パラメータ内容情報及び各パラメータ内容情報が現れる頻度に基づき、用語頻度―逆文書頻度法を利用し、前記グラフモデルにおけるエッジに対応する数値を特定する、ことを特徴とする請求項1~6のいずれか1項に記載の方法。
【請求項8】
情報生成装置であって、
予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得するように配置される取得ユニットであって、前記グラフモデルが前記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ数値との関連関係を表し、前記グラフモデルにおけるノードが前記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、前記グラフモデルにおけるエッジに対応する数値が前記パラメータ名称と前記パラメータ内容情報との関連度合い情報を表す取得ユニットと、
前記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得るように配置される単語セグメンテーションユニットと、
前記単語セットにおけるターゲット単語と前記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成するように配置されるマッチング生成ユニットと、
前記構造化されたテキストデータ及び前記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成するように配置される第1生成ユニットと、
前記融合後のグラフモデルに基づき、前記ターゲットアイテムの要約情報を生成するように配置される第2生成ユニットとを含む、ことを特徴とする情報生成装置。
【請求項9】
電子機器であって、
1つ又は複数のプロセッサと1つ又は複数のプログラムを記憶するための記憶装置とを含み、前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサによって実行される際、前記1つ又は複数のプロセッサに請求項1~7のいずれか1項に記載の方法を実施させる、ことを特徴とする電子機器。
【請求項10】
コンピュータ可読媒体であって、
当該コンピュータ可読媒体に、コンピュータプログラムが記憶され、前記プログラムがプロセッサによって実行される際、請求項1~7のいずれか1項に記載の方法が実現される。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施例は、コンピュータ技術分野に関し、具体的に情報生成方法、装置、電子機器及びコンピュータ可読媒体に関する。
【背景技術】
【0002】
現在、従来のアイテム検索と推薦の技術アプリケーションは、益々多くなるユーザのニーズをよく満たすことができない。推薦システムを閲覧する際に、ユーザは、しばしば情報の氾濫の問題に直面する。ユーザは、いくつかの優れたアイテムの要約によって製品を速やかに知ることを望んでいる。アイテムの要約の生成について、通常採用される方法は、循環ニューラルネットワークに基づき、アイテムの要約を生成することである。しかし、循環ニューラルネットワークは、シリアルテキスト情報しかモデリングすることができず、アイテム情報は、非構造化のテキストシーケンスだけでなく、構造化情報も含む。循環ニューラルネットワークは、構造化された入力を直接的にモデリングすることが困難であり、現在の処理方法は、依然として、文字列シーケンスとして処理し、このような処理方法は、構造化情報を損失させて、モデルの表現能力を低下させる恐れがある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本開示の内容部分は、簡単な形態で構想を紹介するためのものであり、これらの構想は、後の具体的な実施形態の部分において詳細に説明される。本開示の内容部分は、特許請求の範囲の主要な特徴や必須の特徴を特定することを意図するものではなく、要求される特許請求の範囲を制限するためのものでもない。
【課題を解決するための手段】
【0004】
本開示のいくつかの実施例は、上記背景技術に記載の技術的問題を解決するために、情報生成方法、装置、機器及びコンピュータ可読媒体を提供する。
【0005】
第1態様として、本開示のいくつかの実施例は、情報生成方法を提供し、当該方法は、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得し、上記グラフモデルが上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ内容情報との関連関係を表し、上記グラフモデルにおけるノードが上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデルにおけるエッジに対応する数値が上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表すことと、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得ることと、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成することと、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成することと、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成することとを含む。
【0006】
好ましくは、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成することは、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、マッチング結果を得ることと、上記マッチング結果と上記グラフモデルにおけるターゲットエッジとに基づき、マッチング後のグラフモデルを生成し、上記ターゲットエッジが、上記グラフモデルにおいて上記ターゲット単語と上記ターゲット単語に対応するパラメータ名称との関連度合い情報を表すエッジであることとを含む。
【0007】
好ましくは、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成することは、上記融合後のグラフモデルを対応するベクトル行列に変換することと、上記融合後のグラフモデルにおける各ノードに対応するベクトルを特定し、上記各ノードに対応するベクトルが上記パラメータ名称又は上記パラメータ内容情報の特徴情報を表すことと、上記ベクトル行列と上記各ノードに対応するベクトルに基づき、上記ターゲットアイテムの要約情報を生成することとを含む。
【0008】
好ましくは、上記ベクトル行列と上記各ノードに対応するベクトルに基づき、上記ターゲットアイテムの要約情報を生成することは、上記ベクトル行列と上記融合後のグラフモデルにおける各ノードに対応するベクトルを予め訓練されたグラフ畳み込みニューラルネットワークに入力し、第1出力結果を得ることと、上記第1出力結果をコーディングし、第2出力結果を得ることと、上記第2出力結果をデコーディングし、上記ターゲットアイテムの要約情報を得ることとを含む。
【0009】
好ましくは、上記第1出力結果をコーディングし、第2出力結果を得ることは、上記第1出力結果を予め訓練され、時系列テキストデータを処理するコーディングネットワークに入力し、上記第2出力結果を得ることを含む。
【0010】
好ましくは、上記第2出力結果をデコーディングし、上記ターゲットアイテムに対応する要約情報を得ることは、上記第2出力結果を予め訓練され、時系列テキストデータを処理するデコーディングネットワークに入力し、上記ターゲットアイテムの要約情報を得ることを含む。
【0011】
好ましくは、上記グラフモデルにおけるエッジに対応する数値は、以下のステップにより特定され、上記ターゲットアイテムのカテゴリにおける各アイテムのアイテム情報を取得し、上記アイテム情報がパラメータ名称と少なくとも1つのパラメータ数値を含み、上記各アイテムのアイテム情報に基づき、各パラメータ名称に対応する各パラメータ内容情報及び各パラメータ内容情報が上記各アイテムのアイテム情報に現れる回数を特定し、上記各パラメータ名称に対応する各パラメータ内容情報及び各パラメータ内容情報が現れる頻度に基づき、用語頻度―逆文書頻度法を利用し、上記グラフモデルにおけるエッジに対応する数値を特定する。
【0012】
第2態様として、本開示のいくつかの実施例は、情報生成装置を提供し、装置は、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得するように配置される取得ユニットであって、上記グラフモデルが上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ数値との関連関係を表し、上記グラフモデルにおけるノードが上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデルにおけるエッジに対応する数値が上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表す取得ユニットと、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得るように配置される単語セグメンテーションユニットと、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成するように配置されるマッチング生成ユニットと、上記構造化されたテキストデータ及び上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成するように配置される第1生成ユニットと、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成するように配置される第2生成ユニットとを含む。
【0013】
好ましくは、マッチング生成ユニットは、さらに、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、マッチング結果を得、上記マッチング結果と上記グラフモデルにおけるターゲットエッジに基づき、マッチング後のグラフモデルを生成し、上記ターゲットエッジが、上記グラフモデルにおいて上記ターゲット単語と上記ターゲット単語に対応するパラメータ名称との関連度合い情報を表すエッジであるように配置される。
【0014】
好ましくは、第2生成ユニットは、さらに、上記融合後のグラフモデルを対応するベクトル行列に変換し、上記融合後のグラフモデルにおける各ノードに対応するベクトルを特定し、上記各ノードに対応するベクトルが上記パラメータ名称又は上記パラメータ内容情報の特徴情報を表し、上記ベクトル行列と上記各ノードに対応するベクトルに基づき、上記ターゲットアイテムの要約情報を生成するように配置される。
【0015】
好ましくは、第2生成ユニットは、さらに、上記ベクトル行列と上記融合後のグラフモデルにおける各ノードに対応するベクトルを予め訓練されたグラフ畳み込みニューラルネットワークに入力し、第1出力結果を得、上記第1出力結果をコーディングし、第2出力結果を得、上記第2出力結果をデコーディングし、上記ターゲットアイテムの要約情報を得るように配置される。
【0016】
好ましくは、第2生成ユニットは、さらに、上記第1出力結果を予め訓練され、時系列テキストデータを処理するコーディングネットワークに入力し、上記第2出力結果を得るように配置される。
【0017】
好ましくは、第2生成ユニットは、さらに、上記第2出力結果を予め訓練され、時系列テキストデータを処理するデコーディングネットワークに入力し、上記ターゲットアイテムの要約情報を得るように配置される。
【0018】
第3態様として、本開示のいくつかの実施例は、電子機器を提供し、当該電子機器は、1つ又は複数のプロセッサと、1つ又は複数のプログラムが記憶された記憶装置とを含み、1つ又は複数のプログラムが1つ又は複数のプロセッサによって実行される際、1つ又は複数のプロセッサに第1態様のいずれかの方法を実施させる。
【0019】
第4態様として、本開示のいくつかの実施例は、コンピュータ可読媒体を提供し、当該コンピュータ可読媒体に、コンピュータプログラムが記憶され、プログラムがプロセッサによって実行される際、第1態様のいずれかの方法が実現される。
【発明の効果】
【0020】
本開示の上記各実施例において、以下の有益な効果を有し、本開示のいくつかの実施例の情報生成方法により、シリアル化されたテキストデータと構造化されたテキストデータの特徴情報を考慮することにより、ターゲットアイテムの要約情報を正確且つ効果的に生成することができる。具体的には、循環ニューラルネットワークは、シリアルテキスト情報しかモデリングすることができず、アイテム情報は、非構造化のテキストシーケンスだけでなく、構造化情報も含むためである。循環ニューラルネットワークは、構造化された入力を直接的にモデリングすることが困難であり、現在の処理方法は、依然として、文字列シーケンスとして処理し、このような処理方法は、構造化情報を損失させて、モデルの表現能力を低下させる恐れがある。これに基づき、本開示のいくつかの実施例の情報生成方法は、まず予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得することができる。また、上記グラフモデルは、上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ内容情報との関連関係を表し、上記グラフモデルにおけるノードは、上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデルにおけるエッジに対応する数値は、上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表す。ここで、上記グラフモデルは、後続の単語セットにおけるターゲット単語に対応するパラメータ名称を特定するために用いられ、後続のマッチング後のグラフモデルの生成のための基礎を築く。なお、上記グラフモデルを取得してターゲットアイテムに関連するシリアル化されたテキストデータを構造化されたデータに変換する。そして、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得る。さらに、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そして、マッチング結果に基づき、マッチング後のグラフモデルを生成する。次に、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成する。ここで、融合後のグラフモデルは、ターゲットアイテムに関連する構造化されたテキスト情報を表す。最後に、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成する。これによりわかるように、上記情報生成方法は、シリアル化されたテキストデータと構造化されたテキストデータの特徴情報を考慮することにより、ターゲットアイテムの要約情報を正確且つ効果的に生成することができる。
【図面の簡単な説明】
【0021】
図面を参照して以下の具体的な実施形態を参照すると、本開示の各実施例の上記及び他の特徴、利点及び態様はより明らかになる。図面において、同一または類似の符号は、同一または類似の要素を示す。図面は模式的なものであり、素子と要素は必ずしも比例して描かれていない。
【0022】
【
図1】本開示のいくつかの実施例の情報生成方法の1つの応用シーンの模式図である。
【
図2】本開示のいくつかの実施例の情報生成方法の1つの応用シーンの模式図である。
【
図3】本開示のいくつかの実施例の情報生成方法の1つの応用シーンの模式図である。
【
図4】本開示の情報生成方法に係るいくつかの実施例のフローチャートである。
【
図5】本開示の情報生成方法に係る別のいくつかの実施例のフローチャートである。
【
図6】本開示の情報生成装置に係るいくつかの実施例の構成模式図である。
【
図7】本開示のいくつかの実施例を実現することに適する電子機器の構成模式図である。
【発明を実施するための形態】
【0023】
以下に添付図面を参照して本開示の実施例をさらに詳しく説明する。添付図面に本開示のある実施例を示したが、本開示は各種の形式によって実現でき、かつここで説明した実施例に限定されると解釈されるべきではないことを理解すべきである。逆に、これらの実施例を提供するのは本開示をより徹底的かつ完全に理解するためである。理解すべきなのは、本開示の添付図面および実施例は例示的な作用のみに用いられ、本開示の保護範囲を制限することに用いられないことである。
【0024】
なお、図面は説明の便宜上、発明に関連する部分のみを示している。矛盾しない場合、本開示における実施例及び実施例における特徴は互いに組み合わせることができる。
【0025】
なお、本開示において言及される「第1」、「第2」等の概念は、異なる装置、モジュール又はユニットを区別するためのものに過ぎず、これらの装置、モジュール又はユニットが実行する機能の順序又は相互依存関係を限定するものではない。
【0026】
本開示において言及される「1つ」、「複数」の修飾は、限定的ではなく模式的なものであり、当業者は、文脈において特に明記しない限り、「1つまたは複数」と理解すべきである。
【0027】
本開示の実施形態における複数の装置間でやり取りされるメッセージ又は情報の名称は、説明のためのものに過ぎず、これらのメッセージ又は情報の範囲を制限するものではない。
【0028】
以下、図面を参照しながら実施例に合わせて本開示を詳細に説明する。
【0029】
図1~
図3は、本開示のいくつかの実施例の情報生成方法の1つの応用シーンの模式図である。
【0030】
図1~3に示すように、電子機器101は、まず予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル105、ターゲットアイテム102に関連するシリアル化されたテキストデータ104及び構造化されたテキストデータ103を取得することができる。また、上記グラフモデル105は、上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ内容情報との関連関係を表し、上記グラフモデル105におけるノードは、上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデル105におけるエッジに対応する数値は、上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表す。本応用シーンでは、上記グラフモデル105は、「スクリーンサイズ―>6.5インチ、関連度合い情報:0.6;スクリーンサイズ―>5.5インチ、関連度合い情報:0.4;色―>薄赤色、関連度合い情報:0.4;色―>白色、関連度合い情報:0.4;色―>黒色、関連度合い情報:0.3、電池容量―>500、関連度合い情報:0.3;電池容量―>mHh、関連度合い情報:0.9;電池容量―>1000、関連度合い情報:0.6;画素―>500、関連度合い情報:0.5;画素―>1000、関連度合い情報:0.4;画素―>800、関連度合い情報:0.5;画素―>万、関連度合い情報:0.8」を含む。上記ターゲットアイテム102は、「携帯電話」であってもよい。上記シリアル化されたテキストデータ104は、「携帯電話ブランド:**、色:赤色系、電池容量:3000mAh、画素:1000万」であってもよい。構造化されたテキストデータ103は、「**携帯電話の品質がよい、スクリーンサイズが大きい、薄赤色、電池容量が大きい、滑り止め・耐摩耗、画素が高い」を含んでもよい。
図2に示すように、そして、上記シリアル化されたテキストデータ104に対して、単語セグメンテーションを行い、単語セット106を得る。さらに、上記単語セット106におけるターゲット単語107と上記グラフモデル105におけるパラメータ名称とをマッチングし、そして、マッチング結果に基づきマッチング後のグラフモデル108を生成する。本応用シーンでは、単語セット106は、「**携帯電話」、「品質」、「良い」、「スクリーンサイズ」、“薄赤色”“大”、“容量”、「大」、「滑り止め」、「耐摩耗」、“画素”、「高」を含んでもよい。ターゲット単語107は、「薄赤色」であってもよい。上記マッチング後のグラフモデル108は、「色―>薄赤色、関連度合い情報:0.4;**携帯電話;品質;良い;スクリーンサイズ;容量:大;耐摩耗:画素;高」を含んでもよい。
図3に示すように、次に、上記構造化されたテキストデータ103と上記マッチング後のグラフモデル108に基づき、融合後のグラフモデル109を得る。最後に、上記融合後のグラフモデル109に基づき、上記ターゲットアイテム102の要約情報110を生成する。本応用シーンでは、融合後のグラフモデル109は、「色―>薄赤色、関連度合い情報:0.4;電池容量―>1000、関連度合い情報:0.6;画素―>1000、関連度合い情報:0.4;スクリーンサイズ―>5.5インチ、関連度合い情報:0.4;**携帯電話;品質;大;良い;耐摩耗;高」を含んでもよい。上記要約情報110は、「**携帯電話、品質が良いこと、スクリーンサイズが大きいこと、5.5インチ、電池容量が大きいこと、1000mAh、画素が高いこと、1000万」であってもよい。
【0031】
なお、上記電子機器101は、ハードウェアであってもよいし、ソフトウェアであってもよい。電子機器がハードウェアである場合、複数のサーバ又は端末デバイスによって構成される分散型クラスタとして実装されてもよいし、単一のサーバ又は単一の端末デバイスとして実装されてもよい。電子機器がソフトウェアとして具現化される場合、上記列挙されたハードウェアデバイスにインストールされてもよい。例えば分散サービスを提供するための複数のソフトウェア又はソフトウェアモジュールとして具現化されてもよいし、単一のソフトウェア又はソフトウェアモジュールとして具現化されてもよい。ここで具体的に限定しない。
【0032】
理解すべきなのは、
図1に示す電子機器の数は、例示的なものに過ぎない。必要に応じて、任意の数の電子機器を有してもよい。
【0033】
引き続き
図4を参照すると、本開示の情報生成方法に係るいくつかの実施例のフロー400が示されている。当該情報生成方法は、以下のステップを含む。
【0034】
ステップ401であって、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、 ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得する。
【0035】
いくつかの実施例では、情報生成方法の実行主体(例えば、
図1に示す電子機器101)は、有線接続方式又は無線接続方式により、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得することができる。また、上記グラフモデルは、上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ内容情報との関連関係を表し、上記グラフモデルにおけるノードは、上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデルにおけるエッジに対応する数値は、上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表す。また、上記関連度合い情報は、0~1の間の数値であってもよい。
【0036】
なお、上記無線接続方式は、3G/4G/5G接続、WiFi接続、ブルートゥース(登録商標)接続、WiMAX接続、Zigbee接続、UWB(ultra wideband)接続、及び現在他の既知され、又は将来開発される無線接続方式を含んでもよいが、これらに限定されない。
【0037】
ステップ402であって、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得る。
【0038】
いくつかの実施例では、上記実行主体は、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得ることができる。例示として、吃音単語セグメンテーションにより上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得ることができる。
【0039】
ステップ403であって、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そして、マッチング結果に基づきマッチング後のグラフモデルを生成する。
【0040】
いくつかの実施例では、上記実行主体は、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づき、マッチング後のグラフモデルを生成することができる。また、上記ターゲット単語は、グラフモデルにおけるパラメータ名称と関連関係がある単語であってもよい。例示として、上記実行主体は、マッチング結果をグラフの形式に変換することができ、マッチング後のグラフモデルを得ることができる。
【0041】
いくつかの実施例のいくつかの選択可能な実現形態において、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づき、マッチング後のグラフモデルを生成することは、以下のステップを含むことができる。
【0042】
第1ステップであって、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、マッチング結果を得る。例示として、上記実行主体は、まず上記単語セットにおけるターゲット単語のセマンティック情報を抽出することができる。そして、グラフモデルにおける各パラメータ名称をトラバースすることにより、ターゲット単語のセマンティック情報に関連するパラメータ名称を特定し、最後に、上記ターゲット単語のセマンティック情報に関連するパラメータ名称と上記ターゲット単語とをマッチングし、マッチング結果を得る。
【0043】
第2ステップであって、上記マッチング結果と上記グラフモデルにおけるターゲットエッジに基づき、マッチング後のグラフモデルを生成する。また、上記ターゲットエッジは、上記グラフモデルにおいて上記ターゲット単語と上記ターゲット単語に対応するパラメータ名称との関連度合い情報を表すエッジである。例示として、上記実行主体は、上記マッチング結果に基づき、上記マッチング後のグラフモデルのノード情報を特定することができる。最後に、上記グラフモデルにおけるターゲットエッジを上記マッチング後のグラフモデルのエッジとすることにより、マッチング後のグラフモデルを生成する。
【0044】
ステップ404であって、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成する。
【0045】
いくつかの実施例のいくつかの選択可能な実現形態において、上記実行主体は、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成することができる。例示として、上記実行主体は、構造化されたテキストデータを上記マッチング後のグラフモデルに融合し、融合後のグラフモデルを得ることができる。ここで、融合後のグラフモデルは、ターゲットアイテムに関連する構造化されたテキスト情報を表す。
【0046】
ステップ405であって、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成する。
【0047】
いくつかの実施例では、上記実行主体は、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成することができる。例示として、上記実行主体は、まず上記融合後のグラフモデルを対応するベクトルに変換することができる。そして、上記対応するベクトルと上記融合後のグラフモデルにおける各ノードに対応するベクトルを予め訓練された循環ニューラルネットワークに入力し、上記ターゲットアイテムの要約情報を得る。
【0048】
いくつかの実施例のいくつかの選択可能な実現形態において、上記グラフモデルにおけるエッジに対応する数値は、以下のステップにより特定される。
【0049】
第1ステップであって、上記ターゲットアイテムのカテゴリにおける各アイテムのアイテム情報を取得し、また、上記アイテム情報は、パラメータ名称と少なくとも1つのパラメータ数値を含む。
【0050】
第2ステップであって、上記各アイテムのアイテム情報に基づき、各パラメータ名称に対応する各パラメータ内容情報と各パラメータ内容情報が上記各アイテムのアイテム情報に現れる回数を特定する。ここで、各アイテムのアイテム情報における各アイテム情報は、少なくとも1つのパラメータ名称に対応する。さらに、各アイテムのアイテム情報に対応するパラメータ名称セットを特定することができる。また、上記パラメータ名称セットには、重複する複数のパラメータ名称が存在する可能性がある。これにより、パラメータ名称セットに対して重複除去を行い、重複除去後のパラメータ名称セットを得ることができる。ここで、重複除去後のパラメータ名称セットにおける各パラメータ名称は、少なくとも1つのパラメータ内容情報に対応する。これにより、各アイテムのアイテム情報により、各パラメータ内容情報が上記各アイテムのアイテム情報に現れる回数を特定することができる。
【0051】
第3ステップであって、上記各パラメータ名称に対応する各パラメータ内容情報と各パラメータ内容情報が現れる頻度に基づき、用語頻度―逆文書頻度法を利用し、上記グラフモデルにおけるエッジに対応する数値を特定する。
【0052】
ここで、用語頻度―逆文書頻度法の主な構想は、ある単語又はフレーズが1つの文章に現れる頻度(Term Frequency、TF)が高く、且つ他の文章にあまり現れない場合、この単語又はフレーズが良好なカテゴリ区分能力を有し、分類に適すると考えられる。逆文書頻度(Inverse Document Frequency、IDF)は、主として、ある単語又はフレーズを含む文書が少ないほど、IDFが大きくなり、この単語又はフレーズが良好なカテゴリ区分能力を有すると意味する。これにより、用語頻度―逆文書頻度法を用いることにより、ある単語又はフレーズがある文章における重要性を計算することができる。
【0053】
本開示の上記各実施例において、以下の有益な効果を有し、本開示のいくつかの実施例の情報生成方法により、シリアル化されたテキストデータと構造化されたテキストデータの特徴情報を考慮することにより、ターゲットアイテムの要約情報を正確且つ効果的に生成することができる。具体的には、循環ニューラルネットワークは、シリアルテキスト情報しかモデリングすることができず、アイテム情報は、非構造化のテキストシーケンスだけでなく、構造化情報も含むためである。循環ニューラルネットワークは、構造化された入力を直接的にモデリングすることが困難であり、現在の処理方法は、依然として、文字列シーケンスとして処理し、このような処理方法は、構造化情報を損失させて、モデルの表現能力を低下させる恐れがある。これに基づき、本開示のいくつかの実施例の情報生成方法は、まず予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得することができる。また、上記グラフモデルは、上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ内容情報との関連関係を表し、上記グラフモデルにおけるノードは、上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデルにおけるエッジに対応する数値は、上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表す。ここで、上記グラフモデルは、後続の単語セットにおけるターゲット単語に対応するパラメータ名称を特定するために用いられ、後続のマッチング後のグラフモデルの生成のための基礎を築く。なお、上記グラフモデルを取得してターゲットアイテムに関連するシリアル化されたテキストデータを構造化されたデータに変換する。そして、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得る。さらに、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そして、マッチング結果に基づき、マッチング後のグラフモデルを生成する。次に、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成する。ここで、融合後のグラフモデルは、ターゲットアイテムに関連する構造化されたテキスト情報を表す。最後に、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成する。これによりわかるように、上記情報生成方法は、シリアル化されたテキストデータと構造化されたテキストデータの特徴情報を考慮することにより、ターゲットアイテムの要約情報を正確且つ効果的に生成することができる。
【0054】
引き続き
図5を参照すると、本開示の情報生成方法に係る別のいくつかの実施例のフロー500が示されている。当該情報生成方法は、以下のステップを含む。
【0055】
ステップ501であって、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得する。
【0056】
ステップ502であって、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得る。
【0057】
ステップ503であって、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づき、マッチング後のグラフモデルを生成する。
【0058】
ステップ504であって、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成する。
【0059】
いくつかの実施例では、ステップ501~504の具体的な実現及び奏する技術的効果は、
図4に対応するそれらの実施例におけるステップ401~404を参照すればよく、ここで繰り返し述べない。
【0060】
ステップ505であって、上記融合後のグラフモデルを対応するベクトル行列に変換する。
【0061】
いくつかの実施例では、実行主体(例えば、
図1に示す電子機器101)は、上記融合後のグラフモデルを対応するベクトル行列に変換することができる。例示として、上記実行主体は、融合後のグラフモデルにおける各エッジに対応する数値に基づき、対応するベクトル行列を生成することができる。また、孤立したノードと他のノードとの関係は、数値0と表すことができる。
【0062】
ステップ506であって、上記融合後のグラフモデルにおける各ノードに対応するベクトルを特定する。
【0063】
いくつかの実施例では、上記実行主体は、上記融合後のグラフモデルにおける各ノードに対応するベクトルを特定することができる。また、上記各ノードに対応するベクトルは、上記パラメータ名称又は上記パラメータ内容情報の特徴情報を表す。例示として、単語埋め込みの方式によって上記融合後のグラフモデルにおける各ノードに対応するパラメータ名称又はパラメータ内容情報を対応するベクトルに変換することができる。
【0064】
ステップ507であって、上記ベクトル行列と上記融合後のグラフモデルにおける各ノードに対応するベクトルを予め訓練されたグラフ畳み込みニューラルネットワークに入力し、第1出力結果を得る。
【0065】
いくつかの実施例では、上記実行主体は、上記ベクトル行列と上記融合後のグラフモデルにおける各ノードに対応するベクトルを予め訓練されたグラフ畳み込みニューラルネットワーク(GCN、Graph Convolutional Network)に入力し、第1出力結果を得ることができる。また、上記グラフ畳み込みネットワークは、多層グラフ畳み込み層であってもよい。上記グラフ畳み込み層は、隣接行列を介して各ノードの隣接情報を集約し、さらに現在のノードの特徴付けを強化し、モデルの入力に対するモデリングの正確性を向上させることができる。多層グラフ畳み込み層モデリングを行うことにより、マルチホップ隣接情報を取得することができる。
【0066】
ステップ508であって、上記第1出力結果をコーディングし、第2出力結果を得る。
【0067】
いくつかの実施例では、上記実行主体は、上記第1出力結果をコーディングし、第2出力結果を得ることができる。例示として、上記実行主体は、上記第1出力結果を予め訓練されたコーディングネットワークに入力し、第2出力結果を得ることができる。
【0068】
いくつかの実施例のいくつかの選択可能な実現形態では、上記実行主体は、上記第1出力結果を予め訓練され、時系列テキストデータを処理するコーディングネットワークに入力し、上記第2出力結果を得ることができる。また、上記時系列テキストデータを処理するコーディングネットワークは、循環ニューラルネットワーク(Recurrent Neural Network,RNN)と長短期記憶ネットワーク(LSTM、Long Short-Term Memory)のうちの1つであってもよい。
【0069】
ステップ509であって、上記第2出力結果をデコーディングし、上記ターゲットアイテムの要約情報を得る。
【0070】
いくつかの実施例では、上記実行主体は、上記第2出力結果をデコーディングし、上記ターゲットアイテムの要約情報を得ることができる。例示として、上記実行主体は、上記第2出力結果を予め訓練されたデコーディングネットワークに入力し、第2出力結果を得ることができる。
【0071】
いくつかの実施例のいくつかの選択可能な実現形態では、上記実行主体は、上記第2出力結果を予め訓練され、時系列テキストデータを処理するデコーディングネットワークに入力し、上記ターゲットアイテムの要約情報を得ることができる。また、上記時系列テキストデータを処理するデコーディングネットワークは、循環ニューラルネットワークと長短期記憶ネットワークのうちの1つであってもよい。
【0072】
図5からわかるように、
図4に対応するいくつかの実施例の説明に比べ、
図5に対応するいくつかの実施例における情報生成方法のフロー500は、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成するステップを示す。これにより、これらの実施例に記載の技術案は、上記ターゲットアイテムの要約情報をより正確、且つ効果的に生成することができる。
【0073】
引き続き
図6を参照すると、上記各図に記載の方法の実現として、本開示は、情報生成装置のいくつかの実施例を提供し、これらの装置の実施例は、
図4に記載の方法の実施例に対応し、当該装置は、具体的に様々な電子機器に適用されてもよい。
【0074】
図6に示すように、いくつかの実施例の情報生成装置600は、取得ユニット601、単語セグメンテーションユニット602、マッチング生成ユニット603、第1生成ユニット604及び第2生成ユニット605を含む。また、取得ユニット601は、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得するように配置され、また、上記グラフモデルは、上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ数値との関連関係を表し、上記グラフモデルにおけるノードは、上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデルにおけるエッジに対応する数値は、上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表す。単語セグメンテーションユニット602は、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得るように配置される。マッチング生成ユニット603は、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成するように配置される。第1生成ユニット604は、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成するように配置される。第2生成ユニット605は、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成するように配置される。
【0075】
いくつかの実施例のいくつかの選択可能な実現形態では、上記情報生成装置600のマッチング生成ユニット603は、さらに、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、マッチング結果を得、上記マッチング結果と上記グラフモデルにおけるターゲットエッジに基づき、マッチング後のグラフモデルを生成するように配置されることが可能であり、また、上記ターゲットエッジは、上記グラフモデルにおいて上記ターゲット単語と上記ターゲット単語に対応するパラメータ名称との関連度合い情報を表すエッジである。
【0076】
いくつかの実施例のいくつかの選択可能な実現形態では、情報生成装置600の第2生成ユニット605は、さらに、上記融合後のグラフモデルを対応するベクトル行列に変換し、上記融合後のグラフモデルにおける各ノードに対応するベクトルを特定し、また、上記各ノードに対応するベクトルが、上記パラメータ名称又は上記パラメータ内容情報の特徴情報を表し、上記ベクトル行列と上記各ノードに対応するベクトルに基づき、上記ターゲットアイテムの要約情報を生成するように配置されることが可能である。
【0077】
いくつかの実施例のいくつかの選択可能な実現形態では、情報生成装置600の第2生成ユニット605は、さらに、上記ベクトル行列と上記融合後のグラフモデルにおける各ノードに対応するベクトルを予め訓練されたグラフ畳み込みニューラルネットワークに入力し、第1出力結果を得、上記第1出力結果をコーディングし、第2出力結果を得、上記第2出力結果をデコーディングし、上記ターゲットアイテムの要約情報を得るように配置されることが可能である。
【0078】
いくつかの実施例のいくつかの選択可能な実現形態では、情報生成装置600の第2生成ユニット605は、さらに、上記第1出力結果を予め訓練され、時系列テキストデータを処理するコーディングネットワークに入力し、上記第2出力結果を得るように配置されることが可能である。
【0079】
いくつかの実施例のいくつかの選択可能な実現形態では、情報生成装置600の第2生成ユニット605は、さらに、上記第2出力結果を予め訓練され、時系列テキストデータを処理するデコーディングネットワークに入力し、上記ターゲットアイテムの要約情報を得るように配置されることが可能である。
【0080】
理解できるように、当該装置600に記載の諸ユニットは、
図4を参照して説明する方法における各ステップに対応する。これにより、上述した方法に対して説明した操作、特徴及び奏する有益な効果は、同様に装置600及びそれに含まれるユニットに適用し、ここで繰り返し述べない。
【0081】
以下、
図7を参照すると、それは、本開示のいくつかの実施例を実現する電子機器700の構成模式図を示す。
図7に示す電子機器は、1つの例示に過ぎず、本開示の実施例の機能及び使用範囲にいかなる制限をもたらすべきではない。
【0082】
図7に示すように、電子機器700は、処理装置(例えば中央処理装置、グラフィックスプロセッサなど)701を含むことができ、それは、読み出し専用メモリ(ROM)702に記憶されたプログラム又は記憶装置707からランダムアクセスメモリ(RAM)703にロードするプログラムに従って様々な適切な動作及び処理を実行することができる。RAM 703には、さらに電子機器700の操作に必要な様々なプログラムとデータが記憶されている。処理装置701、ROM 702及びRAM 703は、バス704を介して互いに接続される。入力/出力(I/O)インターフェース705もバス704に接続される。
【0083】
通常、以下の装置、例えばタッチスクリーン、タッチパッド、キーボード、マウス、カメラ、マイク、加速度計、ジャイロスコープなどを含む入力装置706、例えば液晶ディスプレイ(LCD)、スピーカ、バイブレータなどを含む出力装置707、例えばテープ、ハードディスクなどを含む記憶装置708、及び通信装置709は、I/Oインターフェース705に接続することが可能である。通信装置709は、電子機器700が他のデバイスと無線又は有線通信を行ってデータをやり取りすることを許可することができる。
図7に各種の装置を有する電子機器700が示されているが、理解できるように、すべての示された装置を実施または備えることを要求しないことである。代替的に、より多くの又はより少ない装置を実施または備えることができる。
図7に示す各ブロックは、1つの装置を表すことができるが、必要に応じて複数の装置を表すこともできる。
【0084】
特に、本開示のいくつかの実施例によれば、上述したフローチャートを参照して説明したプロセスは、コンピュータソフトウェアプログラムとして実現することができる。例えば、本開示のいくつかの実施例は、コンピュータプログラム製品を含み、それは、コンピュータ可読媒体に搭載されたコンピュータプログラムを含み、当該コンピュータプログラムは、フローチャートに示す方法を実行するためのプログラムコードを含む。このようないくつかの実施例では、当該コンピュータプログラムは、通信装置709を介してネットワークからダウンロードされてインストールされ、又は記憶装置708からインストールされ、又はROM 702からインストールされることが可能である。当該コンピュータプログラムが処理装置701によって実行される際、本開示のいくつかの実施例の方法に限定された上記機能を実行する。
【0085】
なお、本開示のいくつかの実施例に記載のコンピュータ可読媒体は、コンピュータ読み取り可能な信号媒体又はコンピュータ読み取り可能な記憶媒体又は上記両者の任意の組み合わせであってもよい。コンピュータ読み取り可能な記憶媒体は、例えば、電気、磁気、光、電磁、赤外線、又は半導体のシステム、装置又はデバイス、又は任意の以上の組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能な記憶媒体のより具体的な例は、1つ又は複数の導線を有する電気的な接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ (EPROM又はフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスク読み出し専用メモリ(CD―ROM)、光記憶デバイス、磁気記憶デバイス、又は上記の任意の組み合わせであってもよいが、これらに限定されない。本開示のいくつかの実施例では、コンピュータ読み取り可能な記憶媒体は、プログラムを含むか、又は記憶する有体媒体であってもよく、当該プログラムは、システム、装置又はデバイスの使用又はそれと合わせて使用することを実行するように指示されることが可能である。本開示のいくつかの実施例では、コンピュータ読み取り可能な信号媒体は、ベースバンドに又は搬送波の一部として伝播するデータ信号を含んでもよく、その中にコンピュータ読み取り可能なプログラムコードが搭載されている。このように伝播するデータ信号は、複数の形態を採用することができ、電磁信号、光信号又は上記の任意の適切な組み合わせを含むが、これらに限定されない。コンピュータ読み取り可能な信号媒体は、さらにコンピュータ読み取り可能な記憶媒体以外の任意のコンピュータ可読媒体であってもよく、当該コンピュータ読み取り可能な信号媒体は、指令によってシステム、装置又は器件使用又はそれと組み合わせて使用するプログラムを実行するように送信、伝播又は伝送することができる。コンピュータ可読媒体に含まれるプログラムコードは、任意の適切な媒体で伝送することができ、電線、光ファイバー、RF((無線周波数)など、又は上記の任意の適切な組み合わせを含むが、それらに限定されない。
【0086】
いくつかの実施形態では、クライアント、サーバは、例えばHTTP(HyperText Transfer Protocol、ハイパーテキスト転送プロトコル)のような任意の現在既知され、又は将来開発されるネットワークプロトコルを利用して通信を行うことができ、且つ任意の形態、又は媒体のデジタルデータ通信(例えば、通信ネットワーク)と相互接続することができる。通信ネットワークの例示は、ローカルエリアネットワーク(「LAN」)、広域ネットワーク(「WAN」)、エクストラネット(例えば、インターネット)及びエンドツーエンドネットワーク(例えば、アドホックエンドツーエンドネットワーク)、及び任意の現在既知され、又は将来開発されるネットワークを含む。
【0087】
上記コンピュータ可読媒体は、上記装置に含まれるものであってもよいし、単独で存在し、当該電子機器に実装されていないものであってもよい。上記コンピュータ可読媒体に1つ又は複数のプログラムが搭載されており、上記1つ又は複数のプログラムが当該電子機器によって実行される際、当該電子機器に、予め構築され、ターゲットアイテムのカテゴリに関連するグラフモデル、ターゲットアイテムに関連するシリアル化されたテキストデータ及び構造化されたテキストデータを取得し、また、上記グラフモデルが上記ターゲットアイテムのカテゴリのパラメータ名称と各パラメータ内容情報との関連関係を表し、上記グラフモデルにおけるノードが上記ターゲットアイテムのカテゴリのパラメータ名称又はパラメータ内容情報を表し、上記グラフモデルにおけるエッジに対応する数値が上記パラメータ名称と上記パラメータ内容情報との関連度合い情報を表し、上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得、上記単語セットにおけるターゲット単語と上記グラフモデルにおけるパラメータ名称とをマッチングし、そしてマッチング結果に基づきマッチング後のグラフモデルを生成し、上記構造化されたテキストデータと上記マッチング後のグラフモデルに基づき、融合後のグラフモデルを生成し、上記融合後のグラフモデルに基づき、上記ターゲットアイテムの要約情報を生成するように実行させる。
【0088】
1種又は複数種のプログラム設計言語又はその組み合わせで本開示のいくつかの実施例の操作を実行するためのコンピュータプログラムコードをプログラミングすることができ、上記プログラム設計言語は、オブジェクト指向のプログラム言語、例えばJava、Smalltalk、C++を含み、さらに通常の手続き型プログラム設計言語、例えば「C」言語、又は類似のプログラム設計言語を含む。プログラムコードは、完全にユーザのコンピュータに実行したり、部分的にユーザのコンピュータに実行したり、独立のソフトウェアパッケージとして実行したり、一部がユーザのコンピュータに実行し、一部が遠隔のコンピュータに実行したり、又は完全に遠隔のコンピュータ又はサーバに実行したりすることができる。遠隔のコンピュータの場合、遠隔のコンピュータは、ローカルエリアネットワーク(LAN)又は広域ネットワーク(WAN)を含む任意の種類のネットワークにより、ユーザのコンピュータに接続されることが可能であり、又は、外部コンピュータ(例えば、インターネットサービスプロバイダを通じてインターネット接続を提供する)に接続されることが可能である。
【0089】
添付図面中のフローチャートとブロック図は、本開示の各種実施例によるシステム、方法とコンピュータプログラム製品の実現可能なアーキテクチャ、機能及び操作を図示する。この点に関して、フローチャート又はブロック図中の各ブロックは、1つのモジュール、プログラムセグメント、又はコードの一部を表すことができ、当該モジュール、プログラムセグメント、又はコードの一部は、1つ又は複数の所定の論理機能を実現するための実行可能な命令を含む。また、一部の代替的な実現において、ブロックに表記された機能は、図面に表記された順序と異なる順序で発生することができることにも注意すべきである。例えば、連続して表示された2つのブロックは実際にほぼ並行に実行することができ、それらは時には逆の順序で実行することもでき、これは、関連する機能によって決まる。また、ブロック図及び/又はフローチャート中の各ブロック、及びブロック図及び/又はフローチャート中のブロックの組み合わせは、所定の機能又は操作を実行する専用のハードウェアに基づくシステムで実現することができ、又は専用のハードウェアとコンピュータ命令の組み合わせで実現することができることにも注意すべきである。
【0090】
本開示のいくつかの実施例に記述されたユニットは、ソフトウェアの形態で実現することができるし、ハードウェアの形態で実現することもできる。記述されたユニットは、プロセッサに設置することができ、例えば、以下のように記述することができ、プロセッサは、取得ユニット、単語セグメンテーションユニット、マッチング生成ユニット、第1生成ユニット及び第2生成ユニットを含む。また、これらのユニットの名称はある状況では当該ユニット自体に対する限定を構成せず、例えば、単語セグメンテーションユニットは、さらに「上記シリアル化されたテキストデータに対して単語セグメンテーションを行い、単語セットを得るユニット」と記述することができる。
【0091】
本文に上述した機能は、少なくとも部分的に1つ又は複数のハードウェアロジック部品によって実行することができる。例えば、非制限的に、使用できる例示的なタイプのハードウェアロジック部品は、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、複雑プログラマブルロジック設備(CPLD)などを含む。
【0092】
以上は本開示のいくつかの好ましい実施例および運用する技術原理に対する説明である。当業者であれば、本開示の実施例に係る発明の範囲は、前記技術的特徴の特定の組み合わせからなる技術的解決手段に限らず、同時に前記発明構想から逸脱しない状況で、前記技術的特徴またはその同等の特徴を任意に組み合わせて形成される他の技術的解決手段をも包含すべきであることを理解すべきである。例えば、前記特徴と本開示の実施例に開示された(しかし限定されない)類似の機能を有する技術的特徴を相互に入れ替えて形成される技術的解決手段である。
【国際調査報告】