(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-24
(54)【発明の名称】テキスト生成方法、装置、電子デバイス及びコンピュータ可読媒体
(51)【国際特許分類】
G06F 40/56 20200101AFI20240117BHJP
【FI】
G06F40/56
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023543062
(86)(22)【出願日】2021-12-17
(85)【翻訳文提出日】2023-07-14
(86)【国際出願番号】 CN2021139098
(87)【国際公開番号】W WO2022151915
(87)【国際公開日】2022-07-21
(31)【優先権主張番号】202110053835.3
(32)【優先日】2021-01-15
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】522442928
【氏名又は名称】北京沃東天駿信息技術有限公司
【氏名又は名称原語表記】BEIJING WODONG TIANJUN INFORMATION TECHNOLOGY CO., LTD.
【住所又は居所原語表記】ROOM A402, 4/F, NO. 2 BUILDING, NO.18 KECHUANG 11TH STREET, ECONOMIC AND TECHNOLOGICAL DEVELOPMENT ZONE, BEIJING 100176, PEOPLE’S REPUBLIC OF CHINA
(71)【出願人】
【識別番号】517241916
【氏名又は名称】北京京東世紀貿易有限公司
【氏名又は名称原語表記】BEIJING JINGDONG CENTURY TRADING CO., LTD.
【住所又は居所原語表記】Room 201, 2/F, Block C, No.18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Beijing 100176, China
(74)【代理人】
【識別番号】110002262
【氏名又は名称】TRY国際弁理士法人
(72)【発明者】
【氏名】李 浩然
(72)【発明者】
【氏名】袁 鵬
(57)【要約】
本開示の実施形態は、テキスト生成方法、装置、電子デバイス及びコンピュータ可読媒体を開示する。具体的な一実施形態における前記方法は、指定された物体を説明するために使用される処理待ちテキストに基づいて、復号化単語情報セットを決定するステップ、候補単語情報セットを生成するために、復号化単語情報セットに対して重複排除処理するステップ、目標単語情報集を得るために、候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択するステップ、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、目標単語情報と目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成するステップを含む。前記実施形態により、テキストトピックを生成する効率と正確度が向上する。
【特許請求の範囲】
【請求項1】
テキスト生成方法であって、
指定された物体を説明するために使用される処理待ちテキストに基づいて、復号化単語情報セットを決定するステップ、
候補単語情報セットを生成するために、前記復号化単語情報セットに対して重複排除処理するステップ、
目標単語情報集を得るために、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択するステップ、
前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成するステップを含むことを特徴とする、方法。
【請求項2】
前記処理待ちテキストに基づいて、復号化単語情報セットを決定することは、
前記処理待ちテキストをテキストエンコーダに入力し、符号化された隠しベクトルを生成するステップと、
前記符号化された隠しベクトルをデコーダーに入力し、復号化単語情報セットを生成するステップとを含むことを特徴とする、請求項1に記載の方法。
【請求項3】
前記復号化単語情報セットにおける復号化単語情報は、復号化単語と前記復号化単語に対応する復号化単語確率値とを含み、また
候補単語情報セットを生成するために、前記復号化単語情報セットに対して重複排除処理することは、
前記復号化単語情報セットにおける各復号化単語情報組に対して、前記復号化単語に基づいて、前記復号化単語情報組を重複復号化単語情報組と単一復号化単語情報組に区分するステップと、
前記重複復号化単語情報組から、プリセット条件を満たす重複復号化単語情報を目標重複復号化単語情報として選択するステップと、
前記目標重複復号化単語情報と前記単一復号化単語情報組をスティッチングして、前記候補単語情報組を生成するステップとを含むことを特徴とする、請求項1または2に記載の方法。
【請求項4】
前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語に基づいて、前記復号化単語情報組を重複復号化単語情報組と単一復号化単語情報組に区分することは、
前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語情報組に前記復号化単語情報を含む復号化単語の他の復号化単語情報が存在することに応答して、前記復号化単語情報と前記他の復号化単語情報を重複復号化単語情報組に入れ、そうでなければ、前記復号化単語情報を単一復号化単語情報組に入れるステップを含むことを特徴とする、請求項3に記載の方法。
【請求項5】
前記候補単語情報セットにおける候補単語情報には、候補単語と、前記候補単語に対応する候補単語確率値とが含まれており、また
前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択することは、
前記候補単語情報セットにおける各候補単語情報組について、前記候補単語確率値の大きい方から小さい方への順に従って、前記候補単語情報組から少なくとも1つの候補単語情報を選択するステップと、
前記少なくとも1つの候補単語情報のうち、最も高い確率値を有する候補単語情報を過去の目標単語情報集に入れ、最も高い確率値を有する前記候補単語情報に対して少なくとも1つの初期目標単語情報を決定し、少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成するステップを含み、少なくとも1つの前記初期目標単語情報における初期目標単語情報には、初期目標単語と、前記初期目標単語に対応する初期目標単語確率値とが含まれることを特徴とする、請求項1~4に記載のいずれか1項に記載の方法。
【請求項6】
少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成することは、
最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集に対応する過去の目標単語情報との間の重複単語確率差を決定するステップと、
前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値よりも大きいことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるステップを含むことを特徴とする、請求項5に記載の方法。
【請求項7】
少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成することは、
最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集に対応する過去の目標単語情報との間の重複単語確率差を決定するステップと、
前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値以下であることに応答して、他の初期目標単語情報における最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるステップを含むことを特徴とする、請求項5に記載の方法。
【請求項8】
少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成することは、
最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属さないことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるステップを含むことを特徴とする、請求項5~7のいずれか1項に記載の方法。
【請求項9】
前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と、前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成することは、
前記目標単語情報集における各目標単語情報について、前記目標単語情報がプリセットの収束条件を満たすと決定したことに応答して、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングしてスティッチングされたテキストを生成するステップと、
前記プリセットの単語リストから、前記スティッチングされたテキストにマッチする単語を接続詞として選択するステップと、
前記接続詞と前記スティッチングされたテキストを組合わせて、目標テキストを生成するステップとを含むことを特徴とする、請求項1~8のいずれか1項に記載の方法。
【請求項10】
テキストを生成する装置であって、
指定された物体を説明するために使用される処理待ちテキストに基づいて、復号化単語情報セットを決定するように構成された決定ユニット、
候補単語情報セットを生成するために、前記復号化単語情報セットに対して重複排除処理するように構成された重複排除ユニット、
目標単語情報集を得るために、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択するように構成された選択ユニット、
目標テキストを生成するために、前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングするように構成されたスティッチングユニットとを備えることを特徴とする、装置。
【請求項11】
電子デバイスであって、
1つ以上のプロセッサと、
1つ以上のプログラムが記憶されている記憶装置とを備え、
1つ以上の前記プログラムが、1つ以上の前記プロセッサによって実行されると、1つ以上の前記プロセッサによって請求項1~9のいずれか1項に記載の方法が実現されることを特徴とする、電子デバイス。
【請求項12】
コンピュータプログラムが記憶されているコンピュータ可読媒体であって、
プロセッサによって前記プログラムが実行される場合、請求項1~9のいずれか1項に記載の方法が実現されることを特徴とするコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、コンピュータ技術の分野に関し、具体的には、テキスト生成方法、装置、電子デバイス及びコンピュータ可読媒体に関する。
【背景技術】
【0002】
コンピュータ技術と深層学習技術の急速な発展に伴い、機械翻訳やテキスト生成(要約の生成など)など、自然言語処理の各研究方向で画期的な進展が得られた。従来のテキスト生成モデルでは、テキスト生成モデルの復号モジュールで一般的に使用されているアルゴリズムである、ビームサーチ(Beam Search、クラスタサーチ)アルゴリズムが復号過程で大きな解空間で貪欲に解くために使用されることが多い。
【0003】
しかし、上記の方法でテキストを生成する場合、従来の検索では、復号化処理過程のテキストトピックの生成効率が悪く、精度も低いという技術的な問題が発生することが多い。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示の内容部分は、アイデアを簡潔な形で説明するために使用され、これらのアイデアは、後に続く具体的な実施形態部分で詳細に説明される。本開示の内容部分は、保護を必要とする技術的解決策の主要な特徴または必要な特徴を識別することを意図しておらず、保護を要求される技術的解決策の範囲を限定するために使用することも意図していない。本開示のいくつかの実施形態は、上記の背景技術部分で言及された技術的課題のうち1つ以上を解決するためのテキスト生成方法、装置、電子デバイス及びコンピュータ可読媒体を提案する。
【0005】
第1の態様において、本開示のいくつかの実施形態では、テキスト生成方法を提供する。前記方法は、指定された物体を説明するために使用される処理待ちテキストに基づいて、復号化単語情報セットを決定するステップ、候補単語情報セットを生成するために、前記復号化単語情報セットに対して重複排除処理するステップ、目標単語情報集を得るために、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択するステップ、前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成するステップを含む。
【0006】
選択的に、処理待ちテキストに基づいて、復号化単語情報セットを決定することは、前記処理待ちテキストをテキストエンコーダに入力し、符号化された隠しベクトルを生成するステップと、前記符号化された隠しベクトルをデコーダーに入力し、復号化単語情報セットを生成するステップとを含む。
【0007】
選択的に、復号化単語情報セットにおける復号化単語情報は、復号化単語と前記復号化単語に対応する復号化単語確率値とを含み、また、候補単語情報セットを生成するために、前記復号化単語情報セットに対して重複排除処理することは、前記復号化単語情報セットにおける各復号化単語情報組に対して、前記復号化単語に基づいて、前記復号化単語情報組を重複復号化単語情報組と単一復号化単語情報組に区分するステップと、前記重複復号化単語情報組から、プリセット条件を満たす重複復号化単語情報を目標重複復号化単語情報として選択するステップと、前記目標重複復号化単語情報と前記単一復号化単語情報組をスティッチングして、前記候補単語情報組を生成するステップとを含む。
【0008】
選択的に、前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語に基づいて、前記復号化単語情報組を重複復号化単語情報組と単一復号化単語情報組に区分することは、前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語情報組に前記復号化単語情報を含む復号化単語の他の復号化単語情報が存在することに応答して、前記復号化単語情報と前記他の復号化単語情報を重複復号化単語情報組に入れ、そうでなければ、前記復号化単語情報を単一復号化単語情報組に入れるステップを含む。
【0009】
選択的に、候補単語情報セットにおける候補単語情報には、候補単語と、前記候補単語に対応する候補単語確率値とが含まれており、また、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択することは、前記候補単語情報セットにおける各候補単語情報組について、前記候補単語確率値の大きい方から小さい方への順に従って、前記候補単語情報組から少なくとも1つの候補単語情報を選択するステップと、前記少なくとも1つの候補単語情報のうち、最も高い確率値を有する候補単語情報を過去の目標単語情報集に入れ、最も高い確率値を有する前記候補単語情報に対して少なくとも1つの初期目標単語情報を決定し、少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成するステップを含む。少なくとも1つの前記初期目標単語情報における初期目標単語情報には、初期目標単語と、前記初期目標単語に対応する初期目標単語確率値とが含まれる。
【0010】
選択的に、少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成することは、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集に対応する過去の目標単語情報との間の重複単語確率差を決定するステップと、前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値よりも大きいことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるステップとを含む。
【0011】
選択的に、少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成することは、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集に対応する過去の目標単語情報との間の重複単語確率差を決定するステップと、前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値以下であることに応答して、他の初期目標単語情報における最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるステップを含む。
【0012】
選択的に、少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成することは、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属さないことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるステップを含む。
【0013】
選択的に、前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と、前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成することは、前記目標単語情報集における各目標単語情報について、前記目標単語情報がプリセットの収束条件を満たすと決定したことに応答して、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、スティッチングされたテキストを生成するステップと、前記プリセットの単語リストから、前記スティッチングされたテキストにマッチする単語を接続詞として選択するステップと、前記接続詞と前記スティッチングされたテキストを組合わせて、目標テキストを生成するステップとを含む。
【0014】
第2の態様において、本開示のいくつかの実施形態は、決定ユニット、重複排除ユニット、選択ユニット及びスティッチングユニットから構成されるテキストを生成する装置を提供する。決定ユニットは、指定された物体を説明するために使用される処理待ちテキストに基づいて、復号化単語情報セットを決定するように構成される。重複排除ユニットは、候補単語情報セットを生成するために、前記復号化単語情報セットに対して重複排除処理するように構成される。選択ユニットは、目標単語情報集を得るために、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択するように構成される。スティッチングユニットは、目標テキストを生成するために、前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングするように構成される。
【0015】
選択的に、決定ユニットはさらに、前記処理待ちテキストをテキストエンコーダに入力して、符号化された隠しベクトルを生成し、前記符号化された隠しベクトルをデコーダーに入力して、復号化単語情報セットを生成するように構成される。
【0016】
選択的に、復号化単語情報セットにおける復号化単語情報は、復号化単語と前記復号化単語に対応する復号化単語確率値とを含み、また、重複排除ユニットはさらに、前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語に基づいて、前記復号化単語情報組を重複復号化単語情報組と単一復号化単語情報組とに区分し、前記重複復号化単語情報組から、プリセット条件を満たす重複復号化単語情報を目標重複復号化単語情報として選択し、前記目標重複復号化単語情報と前記単一復号化単語情報組とをスティッチングして、前記候補単語情報組を生成するように構成される。
【0017】
選択的に、重複排除ユニットはさらに、前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語情報組に、前記復号化単語情報を含む復号化単語の他の復号化単語情報が存在することに応答して、前記復号化単語情報と前記他の復号化単語情報とを重複復号化単語情報組に入れ、そうでなければ、前記復号化単語情報を単一復号化単語情報組に入れるように構成される。
【0018】
選択的に、候補単語情報セットにおける候補単語情報は、候補単語と前記候補単語に対応する候補単語確率値を含み、また、選択ユニットはさらに、前記候補単語情報セットにおける各候補単語情報組について、前記候補単語確率値の大きい方から小さい方への順に従って、前記候補単語情報組から少なくとも1つの候補単語情報を選択し、前記少なくとも1つの候補単語情報のうち、最も高い確率値を有する候補単語情報を過去の目標単語情報集に入れ、最も高い前記確率値を有する候補単語情報に対して少なくとも1つの初期目標単語情報を決定し、少なくとも1つの前記初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成するように構成される。少なくとも1つの前記初期目標単語情報における初期目標単語情報は、初期目標単語と、前記初期目標単語に対応する初期目標単語確率値とを含む。
【0019】
選択的に、選択ユニットはさらに、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と前記過去の目標単語情報集のうち対応する過去の目標単語情報との間の重複単語確率差を決定し、前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値よりも大きいことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるように構成される。
【0020】
選択的に、選択ユニットはさらに、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と前記過去の目標単語情報集のうち対応する過去の目標単語情報との間の重複単語確率差を決定し、前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値以下であることに応答して、他の初期目標単語情報における最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるように構成される。
【0021】
選択的に、選択ユニットはさらに、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属さないことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるように構成される。
【0022】
選択的に、スティッチングユニットはさらに、前記目標単語情報集における各目標単語情報について、前記目標単語情報がプリセットの収束条件を満たすと決定したことに応答して、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、スティッチングされたテキストを生成し、前記プリセットの単語リストから、前記スティッチングされたテキストにマッチする単語を接続詞として選択し、前記接続詞と前記スティッチングされたテキストとを組合せて、目標テキストを生成するように構成される。
【0023】
第3の態様において、本開示のいくつかの実施形態は、1つ以上のプロセッサと、1つ以上のプログラムが記憶されている記憶装置とを備え、1つ以上のプログラムが1つ以上のプロセッサによって実行されると、1つ以上のプロセッサによって、前記第1の態様のいずれか1つの実施形態に記載された方法が実現される電子デバイスを提供する。
【0024】
第4の態様において、本開示のいくつかの実施形態は、コンピュータプログラムが記憶されており、ここで、プログラムがプロセッサによって実行される場合、前記第1の態様のいずれか1つの実施形態に記載の方法が実現されるコンピュータ可読媒体を提供する。
【発明の効果】
【0025】
本開示の前記各実施形態は、本開示のいくつかの実施形態におけるテキスト生成方法によって、テキストトピックの生成効率と精度を向上させる有益な効果を有する。具体的には、テキストトピックを生成する効率と精度が低い原因は、重複された同じテキストに対して重複排除処理されず、重複テキストに対応する重複情報が、その後の計算に関与し、その結果、生成されたテキストに多くの重複テキストが存在し、テキストトピックを生成する効率と精度が低下するためである。これに基づいて、本開示のいくつかの実施形態におけるテキスト生成方法は、まず、処理待ちテキストに基づいて、復号化単語情報セットを決定する。このようにして、生成された復号化単語情報セットは、その後のテキストの重複排除及び目標テキストを生成するためにデータサポートを提供する。次に、前記復号化単語情報セットに対して重複排除処理することによって、候補単語情報セットを生成する。前記復号化単語情報セットにおける各復号化単語情報組には、同じ復号化単語を有する復号化単語情報が存在する場合が多いため、前記同じ復号化単語を有する復号化単語情報を重複排除処理することにより、テキストトピックを生成する効率を向上させることができる。再び、目標単語情報集を得るために、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択することができる。候補単語情報セットから、強い注目を集める目標単語情報集を選択する。最後に、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、目標単語情報と目標単語情報に対応する過去の目標単語情報シーケンスをテキスト・スティッチングして、目標テキストを生成する。前記プリセットの単語リストは、話し言葉の用語集で構成された単語リストである。前記プリセットの単語リストと、注目度や流暢性の高い目標単語情報集とを組合せることにより、テキストトピックを生成する精度を向上させることができる。
【図面の簡単な説明】
【0026】
本開示の実施形態の上記と他の特徴、利点及び態様は、添付の図面を結合して、以下の特定の実施形態を参照することで、より明らかになる。添付図面を通して、同一または類似の添付図面の符号は、同一または類似の要素を示す。添付図面は概略的であり、要素と構成要素は必ずしも縮尺通りに描かれていないことを理解されたい。
【
図1】本開示のいくつかの実施形態によるテキスト生成方法の適用シナリオを示す概略図である。
【
図2】本開示のいくつかの実施形態によるテキスト生成方法のフローチャートである。
【
図3】本開示の他のいくつかの実施形態によるテキスト生成方法のフローチャートである。
【
図4】本開示の他のいくつかの実施形態によるテキスト生成方法の適用シナリオを示す図である。
【
図5】本開示のいくつかの実施形態によるテキスト生成装置の構造を示す概略図である。
【
図6】本開示のいくつかの実施形態を実施するために適した電子デバイスの構造を示す概略図である。
【発明を実施するための形態】
【0027】
本開示の実施形態は、添付の図面を参照しながら以下でより詳細に説明される。本開示の特定の実施形態については添付図面に示されているが、本開示は様々な形態で実施でき、本明細書に示された実施形態に限定されると解釈されるべきではないことが理解されるべきである。対照的に、これらの実施形態は、本開示をより徹底的かつ完全に理解するために提供される。本開示の添付図面及び実施形態は、例示的な役割にのみ使用され、本開示の保護範囲を制限することを意図していないことを理解されたい。
【0028】
また、説明を容易にするために、添付図面には当該発明に関連する部分のみを示していることに留意されたい。本開示の実施形態及び実施形態における特徴は、矛盾がない場合、互いに組み合わせることができる。
【0029】
本開示で言及される「第1」及び「第2」等の概念は、異なる装置、モジュールまたはユニットを区別するためにのみ使用され、これらの装置、モジュールまたはユニットによって実行される機能の順序または相互依存関係を限定することを意図していないことに留意されたい。
【0030】
本開示で言及される「1つ」及び「1つ以上」の修飾は、限定的ではなく例示的であり、文脈で特に明示に指摘されない限り、「1つ以上」を意味すると当業者は理解されるべきである。
【0031】
本開示の本実施形態における複数の装置間で相互作用するメッセージまたは情報の名称は、例示的な目的のためにのみ使用され、それらのメッセージまたは情報の範囲を限定することを意図するものではない。
【0032】
本開示は、添付図面を参照し、実施形態と組合わせて、以下に詳細に説明される。
【0033】
図1は、本開示のいくつかの実施形態におけるテキスト生成方法の適用シナリオを示す概略図である。
【0034】
図1の適用シナリオにおいて、まず、コンピューティング・デバイス101は、処理待ちテキスト102(例えば、「洗濯機」、「洗濯機」、「お手入れ」、「お手入れ」、「衣類」、「衣類」、「美しい」、「美しい」、「洗浄」)に基づいて、復号化単語情報セット103(例えば:[「洗濯機」:0.03、「洗濯機」:0.07、「お手入れ」:0.02、「お手入れ」:0.01、「衣類」:0.4、「衣類」:0.1、「美しい」:0.1、「美しい」:0.01、「洗浄」:0.04]、[「洗濯機」:0.01、「洗濯機」:0.04、「お手入れ」:0.06、「お手入れ」:0.02、「衣類」:0.04、「衣類」:0.07、「美しい」:0.01、「美しい」:0.5、「洗浄」:0.01])を決定することができる。ここで、前記処理待ちテキスト102は、指定された物体を説明するために使用される。そして、コンピューティング・デバイス101は、前記復号化単語情報セット103に対して重複排除処理し、候補単語情報セット104(例えば:[「洗濯機」:0.07、「お手入れ」:0.02、「衣類」:0.4、「美しい」:0.1、「洗浄」:0.04]、[「洗濯機」:0.04、「お手入れ」:0.06、「衣類」:0.07、「美しい」:0.5、「洗浄」:0.01])を生成することができる。その後、コンピューティング・デバイス101は、前記候補単語情報セット104における各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択し、目標単語情報集105(例えば:「衣類」:0.4、「美しい」:0.5)を得ることができる。最後に、コンピューティング・デバイス101は、前記目標単語情報集105における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リスト106(例えば:「あなたの」、「もっと」、「可能」、「有効的に」…。)に基づいて、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンス107(例えば:[「洗濯機」:0.4、「洗浄」:0.3]、[「お手入れ」:0.5、「衣類」:0.6])をスティッチングして、目標テキスト108(例えば[「洗濯機で衣類を効率よく洗う」]、[「衣類を美しくするためにお手入れます」])を生成する。
【0035】
前記コンピューティング・デバイス101は、ハードウェアまたはソフトウェアであってもよいことに留意されたい。コンピューティング・デバイスがハードウェアである場合、それは、複数のサーバまたは端末デバイスの分散クラスタとして実装され得るか、または単一のサーバまたは単一の端末デバイスとして実装され得る。コンピューティング・デバイスがソフトウェアとして具現化される場合、それは、上記に挙げられるハードウェアデバイスに取り付けられ得る。それは、例えば、分散型サービスを提供するために使用される複数のソフトやソフトモジュールとして、または単一のソフトやソフトモジュールとして実装することができる。ここでは特に限定しない。
【0036】
図1のコンピューティング・デバイスの数は、概略的なものに過ぎないことを理解されたい。実装の必要性に応じて、任意の数のコンピューティング・デバイスが有する可能性がある。
【0037】
図2を引き続き参照すると、本開示のいくつかの実施形態によるテキスト生成方法のプロセス200が図示されている。前記テキスト生成方法は、処理待ちテキストに基づいて、復号化単語情報セットを決定するステップ201を含む。
【0038】
いくつかの実施形態において、テキスト生成方法の実行本体(例えば、
図1に示すコンピューティング・デバイス101)は、処理待ちテキストに基づいて、復号化単語情報セットを決定してもよく、ここで、前記処理待ちテキストは、処理されるのを待っているテキストであってもよい。前記処理待ちテキストは、指定された物体を説明するための用語集であってもよい。前記復号化単語情報セットは、前記前処理テキストを事前訓練済みのテキスト生成モデルに入力することにより、生成された各時間ステップにおけるいずれか1つの時間ステップの復号化単語情報セットであってもよい。前記事前訓練済みのテキスト生成モデルは、シーケンス対シーケンス(Seq2Seq)モデルであってもよい。前記事前訓練済みのテキスト生成モデルは、シーケンス対抗ネットワーク(SeqGAN)モデルであってもよい。前記復号化単語情報セットにおける復号化単語情報は、復号化単語と、前記復号化単語に対応する復号化単語概率とを含んでもよい。
【0039】
例として、前記処理待ちテキストは、[「洗濯機」、「洗濯機」、「お手入れ」、「お手入れ」、「衣類」、「衣類」、「美しい」、「美しい」、「洗浄」]であってもよい。前記処理待ちテキストを事前訓練済みのテキストの生成モデルに入力して、生成された復号化単語情報セットは、[[「洗濯機」:0.03、「洗濯機」:0.07、「お手入れ」:0.02、「お手入れ」:0.01、「衣類」:0.4、「衣類」:0.1、「美しい」:0.1、「美しい」:0.01、「洗浄」:0.04]、[「洗濯機」:0.01、「洗濯機」:0.04、「お手入れ」:0.06、「お手入れ」:0.02、「衣類」:0.04、「衣類」:0.07、「美しい」:0.01、「美しい」:0.5、「洗浄」:0.01]]であってもよい。
【0040】
ステップ202では、候補単語情報セットを生成するために、復号化単語情報セットは重複排除される。
【0041】
いくつかの実施形態において、前記テキスト生成方法の実行本体は、復号化単語情報セットを重複排除して候補単語情報セットを生成する。ここで、前記復号化単語に基づいて、前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語情報組の中で同じ復号化単語を有する復号化単語情報を重複排除し、同じ復号化単語情報の中で最も高い確率値を有する復号化単語情報のみを保持し、同じ復号化単語を有しない復号化単語情報と、同じ復号化単語情報の中で最も高い確率値を保持する復号化単語情報とを組合せて、候補単語情報組を生成する。
【0042】
例として、前記復号化単語情報セットは、[[「洗濯機」:0.03、「洗濯機」:0.07、「お手入れ」:0.02、「お手入れ」:0.01、「衣類」:0.4、「衣類」:0.1、「美しい」:0.1、「美しい」:0.01、「洗浄」:0.04]、[「洗濯機」:0.01、「洗濯機」:0.04、「お手入れ」:0.06、「お手入れ」:0.02、「衣類」:0.04、「衣類」:0.07、「美しい」:0.01、「美しい」:0.5、「洗浄」:0.01]]であってもよい。前記復号化単語情報セットを重複排除して、生成された候補単語情報セットは、[[「洗濯機」:0.07、「お手入れ」:0.02、「衣類」:0.4、「美しい」:0.1、「洗浄」:0.04]、[「洗濯機」:0.04、「お手入れ」:0.06、「衣類」:0.07、「美しい」:0.5、「洗浄」:0.01]]であってもよい。
【0043】
ステップ203では、目標単語情報集を得るために、候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択する。
【0044】
いくつかの実施形態において、前記テキスト生成方法の実行本体は、候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択し、目標単語情報集を得てもよい。ここで、前記目標条件とは、前記候補情報とは、前記候補単語情報組の中で最も高い確率値を有する候補単語情報であってもよい。
【0045】
例として、前記候補単語情報セットは、[[「洗濯機」:0.07、「お手入れ」:0.02、「衣類」:0.4、「美しい」:0.1、「洗浄」:0.04]、[「洗濯機」:0.04、「お手入れ」:0.06、「衣類」:0.07、「美しい」:0.5、「洗浄」:0.01]]であってもよい。候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択することによって、得られる目標単語情報集は、[[「衣類」:0.4]、[「美しい」:0.5]]であってもよい。
【0046】
ステップ204では、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、目標単語情報と目標単語情報に対応する過去の目標単語情報シーケンスとをテキスト・スティッチングして、目標テキストを生成する。
【0047】
いくつかの実施形態において、前記テキスト生成方法の実行本体は、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、目標単語情報に対応する目標単語と目標単語情報に対応する過去の目標単語情報シーケンスに対応する過去の目標単語のシーケンスとをテキスト・スティッチングして、スティッチングされたテキストを生成してもよい。また、前記プリセットの単語リストの中で、前記スティッチングされたテキストにマッチする単語を決定し、マッチされた単語と前記スティッチングされたテキストとを組合せて、目標テキストを生成する。ここで、前記目標単語情報が収束条件を満たすこととは、前記目標単語情報がプリセットの時間ステップの最後の時間ステップに対応する目標単語情報であってもよい。前記プリセットの単語リストは、話し言葉の用語集で構成された単語リストであってもよい。前記過去の目標単語情報シーケンスにおける過去の目標単語情報は、前記目標単語情報に対応するプリセットの時間ステップにおける各時間ステップで生成された過去の目標単語情報であってもよい。
【0048】
例として、前記目標単語情報集は、[[「衣類」:0.4]、[「美しい」:0.5]]であってもよい。目標単語情報集における各目標単語情報について、目標単語情報がプリセットの時間ステップである最後の時間ステップに対応する目標単語情報を決定したことに応答する。前記プリセットの時間ステップの長さは、3であってもよい。前記目標単語情報は、[「衣類」:0.4]であってもよい。前記目標単語情報に対応する過去の目標単語情報シーケンスは、[[「洗濯機」:0.4]、[「洗浄」:0.3]]であってもよい。前記目標単語情報は、[「美しい」:0.5]であってもよい。前記目標単語情報に対応する過去の目標単語情報シーケンスは、[[「お手入れ」:0.5]、[「衣類」:0.6]]であってもよい。前記プリセットの単語リストは、[「あなたの」、「もっと」、「可能」、「有効的に」]であってもよい。最後のテキストがスティッチングして生成された目標テキスト集は、[[「洗濯機で効率よく衣類を洗浄できる」]、[「あなたの衣類にお手入れして、もっと美しく仕上げる」]]であってもよい。
【0049】
本開示の前記各実施形態は、本開示のいくつかの実施形態におけるテキスト生成方法により、テキストトピックを生成する効率と精度を向上させるという有益な効果を有する。具体的には、テキストトピックを生成する効率と精度が低い原因は、重複された同じテキストに対して重複排除処理されず、重複テキストに対応する重複情報が、その後の計算に関与し、その結果、生成されたテキストに多くの重複テキストが存在し、テキストトピックを生成する効率と精度が低下するためである。これに基づいて、本開示のいくつかの実施形態におけるテキスト生成方法では、まず、処理待ちテキストに基づいて、復号化単語情報セットを決定する。このようにして、生成された復号化単語情報セットは、その後のテキストの重複排除及び目標テキストを生成するためにデータサポートを提供する。次に、前記復号化単語情報セットに対して重複の排除処理することによって、候補単語情報セットを生成する。前記復号化単語情報セットにおける各復号化単語情報組には、同じ復号化単語を有する復号化単語情報が存在する場合が多いため、前記同じ復号化単語を有する復号化単語情報を重複排除処理することにより、テキストトピックを生成する効率を向上させることができる。再び、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択し、目標単語情報集を得ることができる。候補単語情報セットから、強い注目を集める目標単語情報集を選択する。最後に、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、目標単語情報と目標単語情報に対応する過去の目標単語情報シーケンスをテキスト・スティッチングして、目標テキストを生成する。前記プリセットの単語リストは、話し言葉の用語集で構成された単語リストである。前記プリセットの単語リストと、注目度や流暢性の高い目標単語情報集とを組合せることにより、テキストトピックを生成する精度を向上させることができる。
【0050】
図3を引き続き参照すると、
図3は、本開示の他のいくつかの実施形態によるテキスト生成方法のプロセス300を示す。前記テキスト生成方法は、以下のステップを含む。
【0051】
ステップ301では、処理待ちテキストに基づいて、復号化単語情報セットを決定する。
【0052】
いくつかの実施形態において、前記実行本体が処理待ちテキストに基づいて、復号化単語情報セットを決定することは、
符号化された隠しベクトルを生成するために、前記処理待ちテキストをテキストエンコーダに入力する第1のステップを含む。
【0053】
いくつかの実施形態において、前記実行本体は、前記処理待ちテキストをテキストエンコーダに入力して、符号化された隠しベクトルを生成してもよい。前記テキストエンコーダは、処理待ちテキストを低緯度テキストベクトルに圧縮するために使用されてもよい。前記符号化された隠しベクトルは、特定圧縮された単語ベクトルであってもよい。前記テキストエンコーダは、様々なタイプのニューラルネットワークモデルから構成されるエンコーダであってもよい。前記テキストエンコーダは、オートエンコーダであってもよい。前記テキストエンコーダは、シーケンス対シーケンス(seq2seq)モデルにおけるエンコーダであってもよい。
【0054】
第2のステップにおいて、復号化単語情報セットを生成するために、前記符号化された隠しベクトルはデコーダーに入力される。
【0055】
いくつかの実施形態において、前記実行本体は、復号化単語情報セットを生成するために、前記符号化された隠しベクトルをデコーダーに入力することができる。前記デコーダーは、前記符号化された隠しベクトルを事前訓練済みのニューラルネットワーク・モデルに入力して単語復号化されることによって、復号化単語情報セットを生成するために用いられてもよい。前記事前訓練済みのニューラルネットワークモデルは、リカレントニューラルネットワーク(RNN)であってもよい。前記事前訓練済みのニューラルネットワークモデルは、畳み込みニューラルネットワーク(CNN)であってもよい。前記復号化単語情報セットにおける復号化単語情報は、復号化単語及び前記復号化単語に対応する復号化単語確率を含んでもよい。
【0056】
例として、前記処理待ちテキストは、[「洗濯機」、「洗濯機」、「お手入れ」、「お手入れ」、「衣類」、「衣類」、「美しい」、「美しい」、「洗浄」]であってもよい。前記生成された復号化単語情報セットは、[[「洗濯機」:0.03、「洗濯機」:0.07、「お手入れ」:0.02、「お手入れ」:0.01、」衣類」:0.04、「衣類」:0.01、「美しい」:0.1、「美しい」:0.01、「洗浄」:0.4]、[「洗濯機」:0.01、「洗濯機」:0.04、「お手入れ」:0.06、「お手入れ」:0.02、「衣類」:0.4、「衣類」:0.07、「美しい」:0.01、「美しい」:0.05、「洗浄」:0.04]]であってもよい。
【0057】
ステップ302において、復号化単語情報セットにおける各復号化単語情報組について、復号化単語に基づいて、復号化単語情報組を重複復号化単語情報組と単一復号化単語情報組とに区分する。
【0058】
いくつかの実施形態において、前記実行本体は、前記復号化単語情報セットにおける各復号化単語情報組ついて、前記復号化単語情報組に前記復号化単語情報を含む復号化単語の他の復号化単語情報が存在することに応答して、前記復号化単語情報と前記他の復号化単語情報を重複復号化単語情報組に入れてもよく、そうでなければ、前記復号化単語情報を単一復号化単語情報組に入れることができる。前記重複復号化単語情報組における重複復号化単語情報は、同じ復号化単語を有する復号化単語情報であってもよい。前記単一復号化単語情報組における単一復号化単語情報は、同じ復号化単語を有する復号化単語情報であってもよい。
【0059】
例として、前記生成された復号化単語情報セットは、[[「洗濯機」:0.03、「洗濯機」:0.07、「お手入れ」:0.02、「お手入れ」:0.01、」衣類」:0.04、「衣類」:0.01、「美しい」:0.1、「美しい」:0.01、「洗浄」:0.4]、[「洗濯機」:0.01、「洗濯機」:0.04、「お手入れ」:0.06、「お手入れ」:0.02、「衣類」:0.4、「衣類」:0.07、「美しい」:0.01、「美しい」:0.05、「洗浄」:0.04]]であってもよい。
【0060】
前記復号化単語情報セットにおける1つの復号化単語情報:[「洗濯機」:0.03、「洗濯機」:0.07、「お手入れ」:0.02、「お手入れ」:0.01、」衣類」:0.04、「衣類」:0.01、「美しい」:0.1、「美しい」:0.01、「洗浄」:0.4]について、対応する重複復号化単語情報組及び単一復号化単語情報組は、それぞれ[[「洗濯機」:0.03、「洗濯機」:0.07]、[「お手入れ」:0.02、「お手入れ」:0.01]、[「衣類」:0.04、「衣類」:0.01]、[「美しい」:0.1、「美しい」:0.01]]和[「洗浄」:0.4]であってもよい。
【0061】
さらなる例として、前記生成された復号化単語情報セットは、[[「洗濯機」:0.03、「洗濯機」:0.07、「お手入れ」:0.02、「お手入れ」:0.01、」衣類」:0.04、「衣類」:0.01、「美しい」:0.1、「美しい」:0.01、「洗浄」:0.4]、[「洗衣 机」:0.01、「洗濯機」:0.04、「お手入れ」:0.06、「お手入れ」:0.02、「衣類」:0.4、「衣類」:0.07、「美しい」:0.01、「美しい」:0.05、「洗浄」:0.04]]であってもよい。
【0062】
前記復号化単語情報セットにおける他の復号化単語情報:[「洗濯機」:0.01、「洗濯機」:0.04、「お手入れ」:0.06、「お手入れ」:0.02、「衣類」:0.4、「衣類」:0.07、「美しい」:0.01、「美しい」:0.05、「洗浄」:0.04]]について、対応する重複復号化単語情報組及び単一復号化単語情報組は、それぞれ[[「洗濯機」:0.01、「洗濯機」:0.04]、[「お手入れ」:0.06、「お手入れ」:0.02]、[「衣類」:0.4、「衣類」:0.07]、[「美しい」:0.01、「美しい」:0.05]]和[「洗浄」:0.04]であってもよい。
【0063】
ステップ303において、重複復号化単語情報組からプリセットの条件を満たす重複復号化単語情報を目標重複復号化単語情報として選択する。
【0064】
いくつかの実施形態において、前記実行本体は、重複復号化単語情報組からプリセットの条件を満たす重複復号化単語情報を目標重複復号化単語情報として選択してもよい。ここで、前記プリセットの条件は、前記重複復号化単語情報が、前記重複復号化単語情報組の中で最も高い復号化単語確率値を有する重複復号化単語情報であってもよい。前記重複復号化単語情報組における各重複復号化単語情報について、復号化単語確率値の高い方から低い方へと従って、重複復号化単語情報シーケンスを得、重複復号化単語情報シーケンスから、最も高い復号化単語確率値を有する重複復号化単語情報を選択する。
【0065】
例として、前記重複復号化単語情報組は、[[「洗濯機」:0.03、「洗濯機」:0.07]、[「お手入れ」:0.02、「お手入れ」:0.01]、[「衣類」:0.04、「衣類」:0.01]、[「美しい」:0.1、「美しい」:0.01]]であってもよい。生成された目標重複復号化単語情報は、[[「洗濯機」:0.07]、[「お手入れ」:0.02]、[「衣類」:0.04]、[「美しい」:0.1]]であってもよい。
【0066】
さらなる例として、前記重複復号化単語情報組は、[[「洗濯機」:0.01、「洗濯機」:0.04]、[「お手入れ」:0.06、「お手入れ」:0.02]、[「衣類」:0.4、「衣類」:0.07]、[「美しい」:0.01、「美しい」:0.05]]であってもよい。生成された目標重複復号化単語情報は、[[「洗濯機」:0.04]、[「お手入れ」:0.06]、[「衣類」:0.4]、[「美しい」:0.05]]であってもよい。
【0067】
ステップ304において、目標重複復号化単語情報と単一復号化単語情報組とをスティッチングして、候補単語情報組を生成する。
【0068】
いくつかの実施形態において、前記実行本体は、目標重複復号化単語情報と単一復号化単語情報組とをスティッチングして、候補単語情報組生成してもよい。前記スティッチング処理は、復号化単語情報組に基づいて、前記目標重複復号化単語情報と前記目標重複復号化単語情報に対応する単一復号化単語情報組とを組合せて、候補単語情報組を生成してもよい。
【0069】
例として、前記目標重複復号化単語情報は、[[「洗濯機」:0.07]、[「お手入れ」:0.02]、[「衣類」:0.04]、[「美しい」:0.1]]であってもよい。前記目標重複復号化単語情報に対応する単一復号化単語情報組は、[「洗浄」:0.04]であってもよい。2組の情報を組合せて生成された候補単語情報組は、[[「洗濯機」:0.07]、[「お手入れ」:0.02]、[「衣類」:0.04]、[「美しい」:0.1]、[「洗浄」:0.4]]であってもよい。
【0070】
さらなる例として、前記目標重複復号化単語情報は、[[「洗濯機」:0.04]、[「お手入れ」:0.06]、[「衣類」:0.4]、[「美しい」:0.05]]であってもよい。前記目標重複復号化単語情報に対応する単一復号化単語情報組は、[「洗浄」:0.01]であってもよい。2組の情報を組合せて生成された候補単語情報組は、[[「洗濯機」:0.04]、[「お手入れ」:0.06]、[「衣類」:0.4]、[「美しい」:0.05]、[「洗浄」:0.01]]であってもよい。
【0071】
ステップ305において、候補単語情報セットにおける各候補単語情報組について、候補単語確率値の大きい方から小さい方への順に従って、候補単語情報組から少なくとも1つの候補単語情報を選択する。
【0072】
いくつかの実施形態において、前記実行本体は、候補単語情報セットにおける各候補単語情報組について、候補単語確率値の大きい方から小さい方への順に従って、候補単語情報組から少なくとも1つの候補単語情報を選択し、ここで、候補単語情報は、候補単語と、候補単語に対応する候補単語確率値とを含む。
【0073】
例として、前記候補単語情報組は、[[「洗濯機」:0.07]、[「お手入れ」:0.02]、[「衣類」:0.04]、[「美しい」:0.1]、[「洗浄」:0.4]]であってもよい。前記候補単語情報組から、候補単語確率値の大きい方から小さい方への順に従って、選択した少なくとも1つの候補単語情報は、[「美しい」:0.1、「洗浄」:0.4]であってもよい。他の候補単語情報組は、[[「洗濯機」:0.04]、[「お手入れ」:0.06]、[「衣類」:0.4]、[「美しい」:0.05]、[「洗浄」:0.01]]であってもよい。前記候補単語情報組から、候補単語確率値の大きい方から小さい方への順に従って、選択した少なくとも1つの候補単語情報は、[「お手入れ」:0.06、「衣類」:0.4]であってもよい。
【0074】
ステップ306において、前記少なくとも1つの候補単語情報の中で最も高い確率値を有する候補単語情報を過去の目標単語情報集に入れ、前記最も高い確率値を有する候補単語情報に対して少なくとも1つの初期目標単語情報を決定し、前記少なくとも1つの初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成する。
【0075】
いくつかの実施形態において、前記実行本体は、まず、少なくとも1つの候補単語情報における候補単語情報について、少なくとも1つの候補単語情報の中で最も高い確率値を有する候補単語情報を過去の目標単語情報集に入れることができる。次に、最も高い確率値を有する候補単語情報に対応して、少なくとも1つの初期目標単語情報を決定する。最後に、少なくとも1つの初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成する。ここで、前記少なくとも1つの初期目標単語情報における初期目標単語情報は、初期目標単語と、前記初期目標単語に対応する初期目標単語確率値とを含む。少なくとも1つの初期目標単語情報から、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として選択する。
【0076】
例として、前記少なくとも1つの候補単語情報は、[「美しい」:0.1、「洗浄」:0.4]であってもよい。前記少なくとも1つの候補単語情報は、[「お手入れ」:0.06、「衣類」:0.4]であってもよい。最も高い確率値を有する候補単語情報は、[「洗浄」:0.4]または[「衣類」:0.4]であってもよい。過去の目標単語情報集に入れた前記候補単語情報は、[[「洗浄」:0.4]、[「衣類」:0.4]]であってもよい。前記候補単語情報における初期目標単語情報を決定する。前記候補単語情報は、[「洗浄」:0.4]であってもよい。前記候補単語情報に対応する初期目標単語情報は、[「衣類」:0.7、「美しい」:0.1]であってもよく、前記候補単語情報に対応して生成される目標単語情報は、[「衣類」:0.7]であってもよい。前記候補単語情報は、[「衣類」:0.4]であってもよく、前記候補単語情報に対応する初期目標単語情報は、[「衣類」:0.07、「美しい」:0.5]であってもよい。前記候補単語情報に対応して生成される目標単語情報は、[「美しい」:0.5]であってもよい。具体的に、
図4には、目標単語情報を生成するための適用シナリオが示されている。
【0077】
いくつかの実施形態におけるいくつかの選択可能な実装において、前記実行本体は、まず、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、前記最も高い初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集に対応する過去の目標単語情報との間の重複単語確率差を決定してもよい。次に、前記実行本体は、前記重複単語確率差が前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値よりも大きいことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れることができる。
【0078】
例として、前記最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語は、「衣類」であってもよい。前記過去の目標単語情報集は、[[「洗浄」:0.4]、[「衣類」:0.4]]であってもよい。前記最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語の確率値は、0.7であってもよい。前記最も高い初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集に対応する過去の目標単語情報との間の重複単語確率差は、0.3であってもよい。前記他の初期目標単語情報は、[「美しい」:0.1]であってもよい。前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値よりも大きいことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報[「衣類」:0.7]を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集[「洗浄」:0.4、「衣類」:0.7、]に入れる。
【0079】
いくつかの実施形態におけるいくつかの選択可能な実装において、前記実行本体は、まず、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、前記最も高い初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集に対応する過去の目標単語情報との間の重複単語確率差を決定する。次に、前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値以下であることに応答して、他の初期目標単語情報における最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れる。
【0080】
いくつかの実施形態におけるいくつかの選択可能な実装において、前記実行本体は、まず、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属さないことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れる。
【0081】
ステップ307において、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、目標単語情報と目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成する。
【0082】
いくつかの実施形態において、前記実行本体は、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、目標単語情報と目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成することは、以下のステップを含む。
【0083】
第1のステップでは、前記目標単語情報集における各目標単語情報について、前記目標単語情報がプリセットの収束条件を満たすと決定したことに応答して、前記目標単語情報と、前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、スティッチングされたテキストを生成する。
【0084】
例として、前記目標単語情報は、[「衣類」:0.7]であってもよい。前記目標単語情報に対応する過去の目標単語情報シーケンスは、[「洗濯機」:0.3、「洗浄」:0.4]であってもよい。前記目標単語情報と、前記目標単語情報に対応する過去の目標単語情報シーケンスをスティッチングして、生成されたスティッチングされたテキストは、[「洗濯機で衣類を洗浄する」]であってもよい。
【0085】
第2のステップでは、前記プリセットの単語リストから、前記スティッチングされたテキストにマッチする単語を接続詞として選択する。
【0086】
ここで、様々な機械学習法を用いて、前記プリセットの単語リストから、前記スティッチングされたテキストにマッチする単語を接続詞として選択する。
【0087】
例として、前記プリセットの単語リストは、[「あなたの」、「可能」、「有効的に」]であってもよい。選択された接続詞は、[「可能」、「有効的に」]であってもよい。
【0088】
第3ステップでは、前記接続詞と、前記スティッチングされたテキストとを組合せて目標テキストを生成する。
【0089】
例として、前記接続詞と、前記スティッチングされたテキストとを組合せて生成される目標テキストは、[「洗濯機で効率よく衣類を洗浄することができる」]であってもよい。
【0090】
図3から分かるように、
図2に対応するいくつかの実施形態における説明に比較して、
図3に対応するいくつかの実施形態における情報処理方法の流程300を示している。まず、処理待ちテキストに基づいて、復号化単語情報セットを決定する。これにより、生成された復号化単語情報セットは、その後のテキストの重複排除及び目標テキストを生成するためのデータサポートを提供する。次に、候補単語情報セットを生成するために、前記復号化単語情報セットを重複排除処理する。前記復号化単語情報セットにおける各復号化単語情報組には、同じ復号化単語を有する復号化単語情報が存在する場合が多いため、前記同じ復号化単語を有する復号化単語情報を重複排除処理することにより、テキストトピックを生成する効率を向上させる。再び、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択し、目標単語情報集を取得する。ここで、目標単語情報に対応する目標単語が、以前に復号化されていたとしても、前記目標単語情報が現在時間ステップで強い注目度を集めることができれば、目標単語情報として復号化される。これにより、生成された目標単語情報から実際の生活において比較的に流暢な予測単語となる。最後に、目標単語情報集における各目標単語情報について、目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、目標単語情報と、目標単語情報に対応する過去の目標単語情報シーケンスとをテキスト・スティッチングして、目標テキストを生成する。前記プリセットの単語リストは、話し言葉の用語集で構成された単語リストである。前記プリセットの単語リストと、高い注目度と流暢性を有する目標単語情報集とを組合せて、テキストトピックを生成する精度を向上するだけでなく、注目度と流暢性の高い特徴を持つ目標テキストを生成することができる。
【0091】
図5をさらに参照すると、前記各図に示される方法の実現として、本開示は、
図2に示されるこれらの方法の実施形態に対応するテキストを生成する装置のいくつかの実施形態を提供する。前記装置は、具体的に様々な電子デバイスに適用することができる。
【0092】
図5に示すように、いくつかの実施形態におけるテキストを生成する装置500は、決定ユニット501、重複排除ユニット502、選択ユニット503及びスティッチングユニット504を備える。決定ユニット501は、指定された物体を説明するために使用される処理待ちテキストに基づいて、復号化単語情報セットを決定するように構成される。重複排除ユニット502は、候補単語情報セットを生成するために、前記復号化単語情報セットに対して重複排除処理するように構成される。選択ユニット503は、目標単語情報集を得るために、前記候補単語情報セットにおける各候補単語情報組から、目標条件を満たす候補単語情報を目標単語情報として選択するように構成される。スティッチングユニット504は、目標テキストを生成するために、前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と、前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングするように構成される。
【0093】
前記装置500に記載されたユニットは、
図2を参照して説明された方法における各ステップに対応することが理解される。これにより、方法に関連して説明した上の文章の操作、特徴及び生じた有益な効果は、装置500及びそこに含まれるユニットに等しく適用可能であり、ここでは繰り返さないことにする。
【0094】
いくつかの実施形態における選択可能実装において、決定ユニット501はさらに、前記処理待ちテキストをテキストエンコーダに入力して、符号化された隠しベクトルを生成し、前記符号化された隠しベクトルをデコーダーに入力して復号化単語情報セットを生成するように構成される。
【0095】
いくつかの実施形態における選択可能な実装において、復号化単語情報セットにおける復号化単語情報は、復号化単語と前記復号化単語に対応する復号化単語確率値とを含む。また、重複排除ユニット502はさらに、前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語に基づいて、前記復号化単語情報組を重複復号化単語情報組と単一復号化単語情報組とに区分し、前記重複復号化単語情報組から、プリセットの条件を満たす重複復号化単語情報を目標重複復号化単語情報として選択し、前記目標重複復号化単語情報と、前記単一復号化単語情報組とをスティッチングして、前記候補単語情報組を生成するように構成される。
【0096】
いくつかの実施形態における選択可能な実装において、重複排除ユニット502はさらに、前記復号化単語情報セットにおける各復号化単語情報組について、前記復号化単語情報組に前記復号化単語情報を含む復号化単語の他の復号化単語情報が存在することに応答して、前記復号化単語情報と前記他の復号化単語情報を重複復号化単語情報組に入れ、そうでなければ、前記復号化単語情報を単一復号化単語情報組に入れるように構成される。
【0097】
いくつかの実施形態における選択可能な実装において、候補単語情報セットにおける候補単語情報は、候補単語と前記候補単語に対応する候補単語確率値とを含む。また、選択ユニット503はさらに、前記候補単語情報セットにおける各候補単語情報組について、前記候補単語情報組から前記候補単語確率値の大きい方から小さい方への順に従って、少なくとも1つの候補単語情報を選択し、前記少なくとも1つの候補単語情報の中で確率値が最も高い候補単語情報を過去の目標単語情報集に入れ、前記確率値が最も高い候補単語情報に対して、少なくとも1つの初期目標単語情報を決定し、前記少なくとも1つの初期目標単語情報に基づいて、前記候補単語情報に対応する目標単語情報を生成するように構成される。前記少なくとも1つの初期目標単語情報における初期目標単語情報は、初期目標単語と、前記初期目標単語に対応する初期目標単語確率値を含む。
【0098】
いくつかの実施形態における選択可能な実装において、選択ユニット503はさらに、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集の中で対応する過去の目標単語情報との間の重複単語確率差を決定し、前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値よりも大きいことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるように構成される。
【0099】
いくつかの実施形態における選択可能な実装において、選択ユニット503はさらに、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属することに応答して、最も高い前記初期目標単語確率値を有する初期目標単語情報と、前記過去の目標単語情報集の中で対応する過去の目標単語情報との間の重複単語確率差を決定し、前記重複単語確率差が、前記候補単語情報に対応する他の初期目標単語情報の初期目標単語確率値以下であることに応答して、他の初期目標単語情報における最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるように構成される。
【0100】
いくつかの実施形態における選択可能な実装において、選択ユニット503はさらに、最も高い初期目標単語確率値を有する初期目標単語情報に対応する初期目標単語が、前記過去の目標単語情報集に属さないことに応答して、最も高い初期目標単語確率値を有する初期目標単語情報を目標単語情報として設定し、前記目標単語情報を前記過去の目標単語情報集に入れるように構成される。
【0101】
いくつかの実施形態における選択可能な実装において、スティッチングユニット504はさらに、前記目標単語情報集における各目標単語情報について、前記目標単語情報が、プリセット収束条件を満たすと決定したことに応答して、前記目標単語情報と前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、スティッチングされたテキストを生成し、前記プリセットの単語リストから、前記スティッチングされたテキストにマッチする単語を接続詞として選択し、前記接続詞と前記スティッチングされたテキストとを組合せて、目標テキストを生成するように構成される
【0102】
以下、
図6を参照すると、本開示のいくつかの実施形態を実施する電子デバイス(例えば、
図1におけるコンピューティング・デバイス101)600の構造を示す概略図である。
図6に示される電子デバイスは、単に例示であり、本開示の実施形態の機能と使用範囲にいかなる制限も課すべきではない。
【0103】
図6に示すように、電子デバイス600は、読取り専用メモリ(ROM)602に記憶されたプログラム、または記憶装置608からランダムアクセスメモリ(RAM)603にロードされたプログラムに従って、様々な適切な動作及び処理を実行することができる処理装置(例えば、中央プロセッサ、グラフィックプロセッサなど)601を含むことができる。RAM603には、電子デバイス600の動作に必要な様々なプログラムやデータも記憶される。処理装置601、ROM602及びRAM603は、バス604を介して互いに接続されている。また、バス604には、入出力(I/O)インターフェース605が接続されている。
【0104】
一般的には、以下の装置は、例えば、タッチスクリーン、タッチパッド、キーボード、マウス、カメラ、マイク、加速度計、ジャイロスコープなどを含む入力装置606、例えば、液晶ディスプレイ(LCD)、スピーカー、バイブレータなどを含む出力装置607、例えば、磁気テープ、ハードディスクなどを含む記憶装置608、及び通信装置609を含むI/Oインターフェース605に接続されてもよい。通信装置609は、電子デバイス600がデータを交換するために、他のデバイスと無線または有線で通信することを可能にする。
図6は、様々な装置を備えた電子デバイス600を示しているが、示された装置のすべてを実施または備える必要はないことを理解されたい。代替的に、より多くの、またはより少ない装置が実施されまたは備えることができる。
図6に示された各ブロックは、1つの装置を表してもよく、必要に応じて複数の装置を表すことができる。
【0105】
特に、本開示のいくつかの実施形態によれば、フローチャートを参照して上の文章に説明されたプロセスは、コンピュータ・ソフトウェア・プログラムとして実装することができる。例えば、本開示のいくつかの実施形態は、コンピュータ可読媒体に担持されたコンピュータプログラムを含む、コンピュータプログラム製品を含み、前記コンピュータプログラムは、フローチャートに示される方法を実行するためのプログラムコードを含む。いくつかのこのような実施形態において、前記コンピュータプログラムは、通信装置609を介してネットワークからダウンロードされてインストールされてもよく、または記憶装置608から、またはROM602からインストールされることができる。前記コンピュータプログラムは、処理装置601によって実行されると、本開示のいくつかの実施形態の方法において定義される前記機能を実行する。
【0106】
本開示のいくつかの実施形態に記載されたコンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体、または前記両者の任意の組み合わせであってよいことに留意されたい。コンピュータ可読記憶媒体は、例えば、電気、磁気、光、電磁気、赤外線、または半導体のシステム、装置またはデバイス、またはこれらの任意の組み合わせであってよいが、これらに限定されるものではない。コンピュータ可読記憶媒体のより具体的な例としては、1つ以上のワイヤを有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光記憶デバイス、磁気メモリデバイス、または上記の任意の適切な組み合わせが挙げられるが、これらに限らない。本開示のいくつかの実施形態において、コンピュータ可読記憶媒体は、命令実行システム、装置またはデバイスによって、またはそれらと組み合わせて使用され得るプログラムを含む、または記憶する任意の有形媒体であり得る。そして、本開示のいくつかの実施形態において、コンピュータ可読信号媒体は、コンピュータ可読プログラムコードを搬送するベースバンド中に、または搬送波の一部として伝送されるデータ信号を含んでいてもよい。このように伝送されたデータ信号は、電磁信号、光信号、または上記の任意の適切な組み合わせを含むが、これらに限定されない様々な形態を取ることができる。コンピュータ可読信号媒体はまた、命令実行システム、装置またはデバイスによって使用され、またはそれらと組合わせて使用するためのプログラムを送信、伝送または送信することができる、コンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよい。コンピュータ可読媒体に含まれるプログラムコードは、電線、光ファイバーケーブル、RF(無線周波数)等、または上記の任意の適切な組み合わせを含むが、これらに限定されない任意の適切な媒体を使用して送信することができる。
【0107】
いくつかの実施形態において、クライアント、サーバは、HTTPのような現在知られているまたは将来開発される任意のネットワークプロトコルを使用して通信してもよく、任意の形式または媒体のデジタルデータ通信(例えば、通信ネットワーク)と相互接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(「LAN」)、広域ネットワーク(「WAN」)、インターネットワーク(例えば、インターネット)、エンドツーエンドネットワーク(例えば、アドホック・エンドツーエンド・ネットワーク)、及び現在知られているまたは将来開発される任意のネットワークが挙げられる。
【0108】
前記コンピュータ可読媒体は、前記装置に含まれていてもよく、電子装置に組み合わされず、別個に存在してもよい。前記コンピュータ可読媒体は、1つ以上のプログラムを担持し、前記1つ以上のプログラムが前記電子デバイスによって実行される場合、前記電子デバイスは、指定された物体を説明するための処理待ちテキストに基づいて、復号化単語情報セットを決定するステップと、前記復号化単語情報セットを重複排除して、候補単語情報セットを生成し、前記候補単語情報セットにおける各候補単語情報セットから、目標条件を満たす候補単語情報を目標単語情報として選択し、目標単語情報集を取得し、前記目標単語情報集における各目標単語情報について、前記目標単語情報が収束条件を満たすと決定したことに応答して、プリセットの単語リストに基づいて、前記目標単語情報と、前記目標単語情報に対応する過去の目標単語情報シーケンスとをスティッチングして、目標テキストを生成する。
【0109】
本開示のいくつかの実施形態の動作を実行するためのコンピュータプログラムコードは、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語、また、「C」などの従来の手続き型プログラミング言語を含む、1つ以上のプログラミング言語またはそれらの組み合わせで説明することができる。プログラムコードは、ユーザのコンピュータ上で完全に実行することができ、ユーザのコンピュータ上で部分的に実行することができ、独立したパッケージとして実行することができ、ユーザのコンピュータ上で部分的にリモートコンピュータ上で実行することができ、またはリモートコンピュータまたはサーバ上で完全に実行することができる。リモートコンピュータに関連する場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含む任意種類のネットワークを介して、ユーザコンピュータに接続することができ、あるいは、外部コンピュータ(例えば、インターネットサービスプロバイダを使用してインターネットを介して接続する)に接続することができる。
【0110】
添付図面のフローチャート及びブロック図は、本開示の様々な実施形態に従ったシステム、方法、及びコンピュータプログラム製品のアーキテクチャ、機能及び動作の可能な実装を例示している。この点で、フローチャートまたはブロック図の各ブロックは、指定された論理機能を実現するための1つ以上の実行可能命令を含むモジュール、プログラムセグメント、またはコードの一部を表すことができる。また、代替としてのいくつかの実施形態では、ブロックに示された機能は、添付の図面に示された順序とは異なる順序で発生することもあることに留意されたい。例えば、連続的に表される2つのブロックは、実際には実質的に並行して実行することができ、関係する機能に応じて、時には逆の順序で実行されることができる。ブロック図及び/またはフローチャートの各ブロック、ならびにブロック図及び/またはフローチャートにおけるブロックの組み合わせは、指定された機能または動作を実行する専用のハードウェアベースのシステムで実現することができ、または専用のハードウェア及びコンピュータ命令の組み合わせで実現することができることにも留意されたい。
【0111】
本開示のいくつかの実施形態に説明されるユニットは、ソフトウェアによって実装されてもよく、ハードウェアによって実装されてもよい。また、説明されるユニットは、プロセッサに配置されてもよく、例えば、決定ユニット、重複排除ユニット、選択ユニット、及びスティッチングユニットを備えるプロセッサとして説明されてもよい。ここで、これらのユニットの名前は、場合によってはそのユニット自体を限定するものではなく、例えば、重複排除ユニットは、「前記の復号化単語情報セット重複排除して、候補単語情報セットを生成するためのユニット」として説明されてもよい。
【0112】
本明細書で上述した機能は、少なくとも部分的に、1つ以上のハードウェア論理構成要素によって実行され得る。例えば、非限定的に、使用され得るハードウェア論理コンポーネントの例示的なタイプには、フィールドプログラマブルゲートアレイ(FPGA)、専用集積回路(ASIC)、専用標準製品(ASSP)、オンチップシステム(SOC)、複合プログラム可能論理デバイス(CPLD)等が含まれる。
【0113】
以上の説明は、本開示のいくつかの好ましい実施形態の説明と、採用された技術原理の説明に過ぎない。本開示の実施形態によってカバーされる本発明の範囲は、上述の技術的特徴の特定の組み合わせにより生じる技術的解決策に限定されず、上述の発明の概念から逸脱することなく、上述の技術的特徴またはその同等の特徴を任意に組み合わせて形成された他の技術的解決策もカバーすべきであることが、当業者には理解されるはずである。例えば、上記の特徴と、本開示の実施形態に開示されている(ただし、これらに限定されない)類似の機能を有する技術的特徴とを互いに置換して形成された技術的解決策である。
【国際調査報告】