(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-30
(45)【発行日】2022-09-07
(54)【発明の名称】句読点予測方法および装置
(51)【国際特許分類】
G06F 40/289 20200101AFI20220831BHJP
G06F 40/216 20200101ALI20220831BHJP
【FI】
G06F40/289
G06F40/216
(21)【出願番号】P 2020215550
(22)【出願日】2020-12-24
【審査請求日】2020-12-24
(31)【優先権主張番号】202010046714.1
(32)【優先日】2020-01-16
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】100114557
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】リャン,ミンシン
(72)【発明者】
【氏名】フ,シャオイン
【審査官】成瀬 博之
(56)【参考文献】
【文献】Ottokar Tilk 他1名,LSTM for Punctuation Restoration in Speech Transcripts,2015年09月,[令和04年02月14日検索],インターネット<URL:https://www.researchgate.net/publication/278678403>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
句読点予測装置によって実行される句読点予測方法であって、
予測対象のテキストを取得するステップと、
前記
予測対象のテキストを予め設定されたシーケンスラベリングモデルに入力して、前記
予測対象のテキスト内の各文字に対応す
る少なくとも1種の予測結果および
前記少なくとも1種の予測結果
のそれぞれに対応する第1の得点
を取得するステップであって、前記
少なくとも1種の予測結果
のそれぞれが、文字の後に句読点が存在するか否か、および存在する句読点のタイプ
を表すステップと、
前記
予測対象のテキスト内の各文字に対して
、前記予
測対象のテキストおよび前記
少なくとも1種の予測結果のそれぞれと併せて、前記
少なくとも1種の予測結果
のそれぞれに対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記
少なくとも1種の予測結果
のそれぞれに対応する第2の得点を得るステップと、
前記文字の
少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するステップと、
前記
予測対象のテキスト内の各文字の句読点存在状況と併せて、前記
予測対象のテキストに対して句読点処理を行い、前記
予測対象のテキストに対応する句読点テキストを得るステップと、を含む、
ことを特徴とする句読点予測方法。
【請求項2】
前記
予測対象のテキストを予め設定されたシーケンスラベリングモデルに入力して、前記
予測対象のテキスト内の各文字に対応する
少なくとも1種の予測結果および前記少なくとも1種の予測結果のそれぞれに対応する第1の得点を取得する前記ステップは、
前記
予測対象のテキストを予め設定されたシーケンスラベリングモデルに入力して、前記
予測対象のテキスト内の各文字に対応する少なくとも1種の予測結果および予測確率を取得するステップと、
各文字の
少なくとも1種の予測結果のそれぞれに対して、前記
少なくとも1種の予測結果
のそれぞれに対応する予測確率に対して逆数および対数演算を行って、前記
少なくとも1種の予測結果
のそれぞれに対応する第1の得点を得るステップと、を含む、
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記
予測対象のテキスト内の各文字に対して
、前記
予測対象のテキストおよび前記
少なくとも1種の予測結果
のそれぞれと併せて、前記
少なくとも1種の予測結果
のそれぞれに対応する入力対象のテキストを生成
し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記少なくとも1種の予測結果のそれぞれに対応する第2の得点を得、前記文字の少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するステップは、
前記
予測対象のテキスト内の各文字に対して、前記文字が前記
予測対象のテキストの頭文字であるか否かを判断するステップと、
前記文字が前記
予測対象のテキストの頭文字である場合、頭文字の
少なくとも1種の予測結果のそれぞれに対して、前記
予測対象のテキストおよび前記
少なくとも1種の予測結果
のそれぞれと併せて、前記
少なくとも1種の予測結果
のそれぞれに対応する入力対象のテキストを生成
し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記少なくとも1種の予測結果のそれぞれに対応する第2の得点を得、前記文字の少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するステップと、
前記文字が前記予測対象のテキストの頭文字ではない場合、前記頭文字でない文字の
少なくとも1種の予測結果
のそれぞれに対して、前記
予測対象のテキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記
予測対象のテキスト、および前記
少なくとも1種の予測結果
のそれぞれと併せて、前記
少なくとも1種の予測結果
のそれぞれに対応する入力対象のテキストを生成
し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記少なくとも1種の予測結果のそれぞれに対応する第2の得点を得、前記文字の少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するステップと、を含む、
ことを特徴とする請求項1に記載の方法。
【請求項4】
前記頭文字でない文字の
少なくとも1種の予測結果のそれぞれに対応する入力対象のテキストは、前記
予測対象のテキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、
前記予測結果
が文字の後に句読点が存在しない
ことを表す場合、前記
対応する句読点存在状況によって表される内容は空であり、前記予測結果
が文字の後に句読点が存在する
ことを表す場合、前記
対応する句読点存在状況によって表される内容は存在する句読点のタイプである、
ことを特徴とする請求項3に記載の方法。
【請求項5】
前記頭文字でない文字の
少なくとも1種の予測結果のそれぞれに対応する入力対象のテキストは、前記
予測対象のテキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記
予測対象のテキスト
内の前記頭文字でない文字の後の予め設定された数の文字が挿入される、
ことを特徴とする請求項3に記載の方法。
【請求項6】
前記文字の
少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定する前記ステップは、
前記文字の
少なくとも1種の予測結果のそれぞれに対して、前記
少なくとも1種の予測結果
のそれぞれに対応する第1の得点および第2の得点を取得するステップと、
前記第1の得点および前記第2の得点に対して重み付き加算を行って、前記
少なくとも1種の予測結果
のそれぞれに対応する総得点を得るステップと、
対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定するステップと、を含む、
ことを特徴とする請求項1に記載の方法。
【請求項7】
前記
予測対象のテキスト内の各文字の句読点存在状況と併せて、前記
予測対象のテキストに対して句読点処理を行い、前記
予測対象のテキストに対応する句読点テキストを得る前記ステップは、
前記
予測対象のテキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定するステップと、
前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記
予測対象のテキスト内の前記文字の後に句読点を追加するステップと、
前記
予測対象のテキスト内の各文字が処理された後、前記
予測対象のテキストに対応する句読点テキストを得るステップと、を含む、
ことを特徴とする請求項1に記載の方法。
【請求項8】
句読点予測装置であって、
予測対象のテキストを取得するための取得モジュールと、
前記
予測対象のテキストを予め設定されたシーケンスラベリングモデルに入力して、前記
予測対象のテキスト内の各文字に対応す
る少なくとも1種の予測結果および
少なくとも1種の予測結果のそれぞれに対応する第1の得点
を取得するための入力モジュールであって、前記
少なくとも1種の予測結果
のそれぞれが、文字の後に句読点が存在するか否か、および存在する句読点のタイプ
を表す入力モジュールと、
前記
予測対象のテキスト内の各文字に対して、前記
予測対象のテキストおよび前記
少なくとも1種の予測結果
のそれぞれと併せて、前記
少なくとも1種の予測結果
のそれぞれに対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記
少なくとも1種の予測結果
のそれぞれに対応する第2の得点を得るための第1の決定モジュールと、
前記文字の
少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するための第2の決定モジュールと、
前記
予測対象のテキスト内の各文字の句読点存在状況と併せて、前記
予測対象のテキストに対して句読点処理を行い、前記
予測対象のテキストに対応する句読点テキストを得るための句読点処理モジュールと、を含む、
ことを特徴とする句読点予測装置。
【請求項9】
前記入力モジュールは具体的に、
前記
予測対象のテキストを予め設定されたシーケンスラベリングモデルに入力して、前記
予測対象のテキスト内の各文字に対応する少なくとも1種の予測結果および予測確率を取得し、
各文字の
少なくとも1種の予測結果のそれぞれに対して、前記
少なくとも1種の予測結果
のそれぞれに対応する予測確率に対して逆数および対数演算を行って、前記
少なくとも1種の予測結果
のそれぞれに対応する第1の得点を得ることに用いられる、
ことを特徴とする請求項8に記載の装置。
【請求項10】
前記第1の決定モジュール
が、前記
予測対象のテキスト内の各文字に対して、前記文字が前記
予測対象のテキストの頭文字であるか否かを判断し、
前記文字が前記
予測対象のテキストの頭文字である場合、
前記第1の決定モジュールが、頭文字の
少なくとも1種の予測結果のそれぞれに対して、前記
予測対象のテキストおよび前記
少なくとも1種の予測結果
のそれぞれと併せて、前記
少なくとも1種の予測結果
のそれぞれに対応する入力対象のテキストを生成し、
前記入力対象のテキストを予め設定された言語モデルに入力して、前記少なくとも1種の予測結果のそれぞれに対応する第2の得点を得、前記第2の決定モジュールが、前記文字の少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定し、
前記文字が前記
予測対象のテキストの頭文字ではない場合、
前記第1の決定モジュールが、前記頭文字でない文字の
少なくとも1種の予測結果
のそれぞれに対して、前記
予測対象のテキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記
予測対象のテキスト、および前記
少なくとも1種の予測結果
のそれぞれと併せて、前記
少なくとも1種の予測結果
のそれぞれに対応する入力対象のテキストを生成
し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記少なくとも1種の予測結果のそれぞれに対応する第2の得点を得、前記第2の決定モジュールが、前記文字の少なくとも1種の予測結果のそれぞれに対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定する、
ことを特徴とする請求項8に記載の装置。
【請求項11】
前記頭文字でない文字の
少なくとも1種の予測結果のそれぞれに対応する入力対象のテキストは、前記
予測対象のテキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、
前記予測結果
が文字の後に句読点が存在しない
ことを表す場合、前記
対応する句読点存在状況によって表される内容は空であり、前記予測結果
が文字の後に句読点が存在する
ことを表す場合、前記
対応する句読点存在状況によって表される内容は存在する句読点のタイプである、
ことを特徴とする請求項10に記載の装置。
【請求項12】
前記頭文字でない文字の
少なくとも1種の予測結果のそれぞれに対応する入力対象のテキストは、前記
予測対象のテキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記
予測対象のテキスト
内の前記頭文字でない文字の後の予め設定された数の文字が挿入される、
ことを特徴とする請求項10に記載の装置。
【請求項13】
前記第2の決定モジュールは具体的に、
前記文字の
少なくとも1種の予測結果のそれぞれに対して、前記
少なくとも1種の予測結果
のそれぞれに対応する第1の得点および第2の得点を取得し、
前記第1の得点および前記第2の得点に対して重み付き加算を行って、前記
少なくとも1種の予測結果
のそれぞれに対応する総得点を得て、
対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定することに用いられる、
ことを特徴とする請求項8に記載の装置。
【請求項14】
前記句読点処理モジュールは具体的に、
前記
予測対象のテキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定し、
前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記
予測対象のテキスト内の前記文字の後に句読点を追加し、
前記
予測対象のテキスト内の各文字が処理された後、前記
予測対象のテキストに対応する句読点テキストを得ることに用いられる、
ことを特徴とする請求項8に記載の装置。
【請求項15】
電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され
ており、前記命令は、前記少なくとも1つのプロセッサが請求項1~7のいずれかに記載の方法を実行するように、前記少なくとも1つのプロセッサによって実行される、
ことを特徴とする電子機器。
【請求項16】
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項1~7のいずれかに記載の方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項17】
コンピュータプログラムであって、
前記コンピュータプログラムにおける命令が実行された場合に、請求項1~7のいずれかに記載の方法が実行される、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願はデータ処理技術分野に関し、具体的にテキストラベリング技術分野に関し、特に句読点予測方法および装置に関する。
【背景技術】
【0002】
現在のテキスト句読点予測方法は主に、シーケンスラベリングモデルまたは言語モデルを用いて、テキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定するものである。ここで、シーケンスラベリングモデルは、新語や人気ワードに対する適応性が悪く、言語モデルの一般化能力が悪く、テキストにわずかな相違があっても異なる結果を得ることになる可能性があり、句読点予測の効率が悪い。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本出願は句読点予測方法および装置を提供し、シーケンスラベリングモデルおよび言語モデルを組み合わせることによってテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合して、句読点予測の効率を向上させる。
【課題を解決するための手段】
【0004】
本出願の一態様の実施例は、予測対象のテキストを取得するステップと、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第1の句読点予測結果を取得するステップであって、前記第1の句読点予測結果が、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含むステップと、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第2の得点を得るステップと、前記文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するステップと、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るステップと、を含む句読点予測方法を提供する。
【0005】
本出願の一実施例では、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第1の句読点予測結果を取得する前記ステップは、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも1種の予測結果および予測確率を取得するステップと、各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第1の得点を得るステップと、を含む。
【0006】
本出願の一実施例では、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成する前記ステップは、前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断するステップと、前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成するステップと、前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成するステップと、を含む。
【0007】
本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、前記予測結果表示文字の後に句読点が存在しない場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである。
【0008】
本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記テキストないの前記頭文字でない文字の後の予め設定された数の文字が挿入される。
【0009】
本出願の一実施例では、前記文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定する前記ステップは、前記文字の各種の予測結果に対して、前記予測結果に対応する第1の得点および第2の得点を取得するステップと、前記第1の得点および前記第2の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得るステップと、対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定するステップと、を含む。
【0010】
本出願の一実施例では、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得る前記ステップは、前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定するステップと、前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加するステップと、前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得るステップと、を含む。
【0011】
本出願の実施例の句読点予測方法は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第1の句読点予測結果を取得し、第1の句読点予測結果が、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含み、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第2の得点を得て、文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、文字の句読点存在状況を決定し、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合し、句読点予測の効率を向上させる。
【0012】
本出願の他の態様の実施例は、予測対象のテキストを取得するための取得モジュールと、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第1の句読点予測結果を取得するための入力モジュールであって、前記第1の句読点予測結果が、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含む入力モジュールと、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第2の得点を得るための第1の決定モジュールと、前記文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するための第2の決定モジュールと、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るための句読点処理モジュールと、を含む句読点予測装置を提供する。
【0013】
本出願の一実施例では、前記入力モジュールは具体的に、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも1種の予測結果および予測確率を取得し、各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第1の得点を得ることに用いられる。
【0014】
本出願の一実施例では、前記第1の決定モジュールは具体的に、前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断し、前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成することに用いられる。
【0015】
本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、前記予測結果表示文字の後に句読点が存在しない場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである。
【0016】
本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記テキストないの前記頭文字でない文字の後の予め設定された数の文字が挿入される。
【0017】
本出願の一実施例では、前記第2の決定モジュールは具体的に、前記文字の各種の予測結果に対して、前記予測結果に対応する第1の得点および第2の得点を取得し、前記第1の得点および前記第2の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得て、対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定することに用いられる。
【0018】
本出願の一実施例では、前記句読点処理モジュールは具体的に、前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定し、前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加し、前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得ることに用いられる。
【0019】
本出願の実施例の句読点予測装置は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第1の句読点予測結果を取得し、第1の句読点予測結果が、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含み、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第2の得点を得て、文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、文字の句読点存在状況を決定し、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合し、句読点予測の効率を向上させる。
【0020】
本出願の他の態様の実施例は電子機器を提供し、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されるメモリとを含み、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが本出願の実施例の句読点予測方法を実行するように、前記少なくとも1つのプロセッサによって実行される。
【0021】
本出願の他の態様の実施例は、コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに本出願の実施例の句読点予測方法を実行させることに用いられる。
本出願の他の態様では、コンピュータプログラムを提供し、前記コンピュータプログラムにおける命令が実行された場合に、本出願の実施例の句読点予測方法が実行される。
【0022】
上記選択可能な形態が有する他の効果は具体的な実施例と併せて以下に説明する。
【図面の簡単な説明】
【0023】
図面は本解決案をよりよく理解するためのものであり、本出願を限定するものではない。
【
図4】文字の句読点存在状況を決定する概略図である。
【
図6】本出願の実施例の句読点予測方法を実現するための電子機器のブロックである。
【発明を実施するための形態】
【0024】
以下、図面と併せて本出願の例示的な実施例を説明する。理解を促すために、その中には本出願の実施の様々な詳細が含まれており、それらを単なる例示的なものと見なすべきである。そのため、当業者であれば、本出願の精神および趣旨から逸脱しない限り、ここで説明された実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確さおよび簡潔さのために、以下の説明では公知の機能および構造に対する説明は省略されている。
【0025】
以下、図面を参照して本出願の実施例の句読点予測方法および装置を説明する。
【0026】
図1は、本出願の第1の実施例に係る概略図である。ここで、本実施例が提供する句読点予測方法の実行主体は句読点予測装置であり、当該装置はソフトウェアおよび/またはハードウェアの形態で実現でき、当該装置は端末装置またはサーバに配置することができ、当該実施例はこれについて具体的に限定しない。
【0027】
図1に示すように、当該句読点予測方法は以下のステップ101~105を含んでも良い。
【0028】
ステップ101、予測対象のテキストを取得する。
【0029】
本出願では、予測対象のテキストは句読点なしのテキストであってもよい。句読点なしのテキストは、例えば、音声認識システムが音声を認識した後に得られたテキスト、または音声ダビングのプロセスにおける句読点なしのテキストである。
【0030】
ステップ102、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第1の句読点予測結果を取得し、第1の句読点予測結果は、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含む。
【0031】
本出願では、句読点予測装置がステップ102を実行するプロセスは具体的に、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する少なくとも1種の予測結果および予測確率を取得し、各文字の各種の予測結果に対して、予測結果に対応する予測確率に対して逆数および対数演算を行って、予測結果に対応する第1の得点を得るものであってもよい。
【0032】
本出願では、シーケンスラベリングモデルは、例えば、回帰型ニューラルネットワーク(Recurrent Neural Network、RNN)、双方向長短期記憶モデル(bidirectional-Long Short-Term Memory、Bi-LSTM)などであってもよい。双方向長短期記憶モデルを例とすると、当該モデルは入力ウィンドウ、ワードベクトル、BLSTM層およびsoftmax推論層という4つの部分で構成される。入力がテキストである場合、softmax推論層の出力はテキスト内の各文字に対応する少なくとも1種の予測結果および予測確率であってもよい。ここで、「今日の私は元気です」というテキスト内の「元気」という文字を例とすると、当該文字に対応する予測結果は3種類があっても良い。1つは「元気」という文字の後に句読点が存在する場合、1つは「元気」という文字の後に読点が存在する場合、もう1つは「元気」という文字の後に句点が存在する場合である。
【0033】
本出願では、各文字の各種の予測結果に対して、予測結果に対応する予測確率に対して逆数および対数演算を行って、予測結果に対応する第1の得点を得る。ここで、予測結果に対応する予測確率に対して逆数および対数演算を行うことによって、予測確率が高いほど、得点が低く、つまり、得点が低いほど予測確率が高い。
【0034】
本出願では、予め設定されたシーケンスラベリングモデルは、トレーニングデータを用いて初期のシーケンスラベリングモデルをトレーニングして得られたものである。トレーニングデータは予め設定された数より大きいサンプルを含み、各サンプルは、句読点なしのテキストおよび対応する句読点シーケンスを含む。ここで、予め設定された数は5GBレベルの数であってもよい。
【0035】
ステップ103、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第2の得点を得る。
【0036】
本出願では、言語モデルの入力は一段落のテキストであり、出力は一段落のテキストの困惑度である。ここで、困惑度が小さいほど、当該段落のテキストが出現する確率が高いことは示される。そのため、困惑度が小さいほどよい。本出願では、困惑度を得点とする。
【0037】
本出願では、言語モデルの入力が一段落のテキストであるため、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成する必要がある。例えば、「今日の私は元気です」というテキストの文字の「元気」を例とすると、特定の予測結果は「元気」という文字の後に句読点が存在しないものである場合、入力対象のテキストは「私はとても元気」であってもよい。特定の予測結果は「元気」という文字の後に読点が存在するものである場合、入力対象のテキストは「私はとても元気で、」であってもよい。特定の予測結果は「元気」という文字の後に句点が存在するものである場合、入力対象のテキストは「私はとても元気です。」であってもよい。
【0038】
本出願では、予め設定された言語モデルは、トレーニングデータを用いて初期の言語モデルをトレーニングして得られたものである。トレーニングデータは、予め設定された数のサンプルを含み、各サンプルは、句読点なしのテキストおよび対応する句読点テキストを含む。ここで、予め設定された数は1TBレベルの数であってもよい。
【0039】
ステップ104、文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、文字の句読点存在状況を決定する。
【0040】
本出願では、句読点予測装置がステップ104を実行するプロセスは具体的に、文字の各種の予測結果に対して、予測結果に対応する第1の得点および第2の得点を取得し、第1の得点および第2の得点に対して重み付き加算を行って、予測結果に対応する総得点を得て、対応する総得点の最小の予測結果に基づいて、文字の句読点存在状況を決定することを含んでも良い。
【0041】
本出願では、総得点の計算式は、例えば、
score=θ×A+(1-θ)×Bであってもよい。
【0042】
scoreは総得点を表し、θは第2の得点の重みを表し、Aは第2の得点を表し、Bは第1の得点を表す。
【0043】
本出願では、シーケンスラベリングモデルおよび言語モデルの得点を統合する融合アルゴリズムはbeam-search検索アルゴリズムを用いてもよく、当該アルゴリズムはテキスト内の各文字の各種の予測結果に対して、シーケンスラベリングモデルの得点および言語モデルの得点を融合して予測結果を選択することができ、従って後続の計算量を減らす。
【0044】
ステップ105、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。
【0045】
本出願では、句読点予測装置がステップ105を実行するプロセスは具体的に、テキスト内の各文字に対して、文字の句読点存在状況に基づいて、文字の後に句読点が存在するか否かを決定し、文字の後に句読点が存在する場合、存在する句読点のタイプに基づいてテキスト内の文字の後に句読点を追加し、テキスト内の各文字が処理された後、テキストに対応する句読点テキストを得ることであってもよい。
【0046】
本出願では、句読点予測方法の概略図は
図2に示すとおり、
図2では、テキストが「こんにちは私は百度科技園にいる」であり、対応する句読点テキストが「こんにちは、私は百度科技術園にいる。」である。テキストに対して句読点予測を行うプロセスにおいて、シーケンスラベリングモデルおよび言語モデルを組み合わせることによって、シーケンスラベリングモデルおよび言語モデルの利点を統合して、句読点予測の効率を向上させることができる。
【0047】
本出願の実施例の句読点予測方法は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第1の句読点予測結果を取得し、第1の句読点予測結果が、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含み、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第2の得点を得て、文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、文字の句読点存在状況を決定し、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合し、句読点予測の効率を向上させる。
【0048】
図3は本出願の第2の実施例に係る概略図である。
図3に示すように、
図1に示す実施例をもとに、ステップ103は具体的に以下のステップ1031~1033を含むことができる。
【0049】
ステップ1031、テキスト内の各文字に対して、文字がテキストの頭文字であるか否かを判断する。
【0050】
本出願では、頭文字はテキスト内の最初の文字を指す。
【0051】
ステップ1032、文字がテキストの頭文字である場合、頭文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成する。
【0052】
本出願では、文字がテキストの頭文字である場合、頭文字の各種の予測結果に対応する入力対象のテキストは頭文字、および予測結果によって表される内容を含んでも良い。
【0053】
さらに、文字の後の文字は文字の予測結果の得点に大きく影響する。そのため、文字の後の文字と併せて文字の各予測結果の得点を決定することができ、さらに、文字の後の文字と併せて予測結果に対応する入力対象のテキストを生成することができる。そのため、本出願では、文字がテキストの頭文字である場合、頭文字の各種の予測結果に対応する入力対象のテキストは、頭文字、予測結果によって表される内容、およびテキスト内の頭文字の後の予め設定された数の文字を含んでも良い。
【0054】
ステップ1033、文字がテキストの頭文字ではない場合、頭文字でない文字の各予測結果に対して、テキスト内の頭文字でない文字の前の各文字の句読点存在状況、テキスト、および予測結果と併せて、予測結果に対応する入力対象のテキストを生成する。
【0055】
本出願では、文字がテキストの頭文字でない文字である場合、頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、テキスト内の頭文字でない文字の前の文字、頭文字、および予測結果によって表される内容を含んでも良い。
【0056】
さらに、文字がテキストの頭文字でない文字である場合、頭文字でない文字の前の特定の文字の句読点存在状況が、句読点が存在するということである場合、頭文字でない文字の前の各文字の句読点存在状況と併せて入力対象のテキストを生成する。入力対象のテキストの精度および句読点予測の効率を向上させることができる。そのため、文字がテキストの頭文字でない文字である場合、頭文字でない各種の予測結果に対応する入力対象のテキストは、テキスト内の頭文字でない文字の前の文字を含み、各頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、頭文字でない文字、および予測結果によって表される内容が挿入される。
【0057】
前記予測結果は、文字の後に句読点が存在しないことを表す場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである。
【0058】
前の文字の句読点存在状況は、前の文字の後に句読点が存在しないことを表す場合、前の文字の句読点存在状況によって表される内容は空であり、前の文字の後に句読点を挿入しない。前の文字の句読点存在状況は、前の文字の後に句読点が存在することを表す場合、前の文字の句読点存在状況によって表される内容は、存在する句読点のタイプであり、前の文字の後に句読点を挿入する。
【0059】
さらに、文字の後の文字は文字の予測結果の得点に大きく影響する。そのため、文字の後の文字と併せて文字の各予測結果の得点を決定することができ、従って文字の後の文字と併せて予測結果に対応する入力対象のテキストを生成することができる。そのため、本出願では、文字がテキストの頭文字でない文字である場合、非頭文字の各種の予測結果に対応する入力対象のテキストは、テキスト内の頭文字でない文字の前の文字を含み、各頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、頭文字でない文字、予測結果によって表される内容、およびテキスト内の頭文字でない文字の後の予め設定された数の文字が挿入される。
【0060】
本出願では、
図4は、文字の句読点存在状況を決定する概略図である。
図4では、「外」という文字に基づいて、「外」という文字の句読点存在状況が、その後に読点が存在することであると決定すると、後で「私」という文字を処理する際に、「外」という文字および「外」という文字の後の読点と併せて、「私」という文字の各予測結果の得点を決定して選択する。
【0061】
本出願の実施例の句読点予測方法は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第1の句読点予測結果を取得し、テキスト内の各文字に対して、文字が頭文字である場合、文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、文字が頭文字でない文字である場合、前記頭文字でない文字の各予測結果、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成する。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合して、句読点の予測効率を向上させる。
【0062】
上記実施例を実現するために、本出願の実施例は句読点予測装置をさらに提供する。
【0063】
図5は本出願の第3の実施例に係る概略図である。
図3に示すように、当該句読点予測装置100は、予測対象のテキストを取得するための取得モジュール110と、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第1の句読点予測結果を取得するための入力モジュール120であって、前記第1の句読点予測結果が、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含む入力モジュール120と、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第2の得点を得るための第1の決定モジュール130と、前記文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、前記文字の句読点存在状況を決定するための第2の決定モジュール140と、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るための句読点処理モジュール150と、を含む。
【0064】
本出願の一実施例では、前記入力モジュール120は具体的に、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも1種の予測結果および予測確率を取得し、各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第1の得点を得ることに用いられる。
【0065】
本出願の一実施例では、前記第1の決定モジュール130は具体的に、前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断し、前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成することに用いられる。
【0066】
本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、前記予測結果表示文字の後に句読点が存在しない場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである。
【0067】
本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記テキストないの前記頭文字でない文字の後の予め設定された数の文字が挿入される。
【0068】
本出願の一実施例では、前記第2の決定モジュール140は具体的に、前記文字の各種の予測結果に対して、前記予測結果に対応する第1の得点および第2の得点を取得し、前記第1の得点および前記第2の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得て、対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定することに用いられる。
【0069】
本出願の一実施例では、前記句読点処理モジュール150は具体的に、前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定し、前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加し、前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得ることに用いられる。
【0070】
なお、上記句読点予測方法に対する説明は本実施例の句読点予測装置にも適用するため、ここで説明を省略する。
【0071】
本出願の実施例の句読点予測装置は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第1の句読点予測結果を取得し、第1の句読点予測結果が、少なくとも1種の予測結果および各種の予測結果に対応する第1の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含み、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第2の得点を得て、文字の各種の予測結果に対応する第1の得点および第2の得点と併せて、文字の句読点存在状況を決定し、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合し、句読点予測の効率を向上させる。
【0072】
本出願の実施例をもとに、本出願は電子機器および読み取り可能な記憶媒体を提供する。
本出願の実施例によれば、コンピュータプログラムが提供される。当該コンピュータプログラムにおける命令が実行された場合に、上記句読点予測方法が実行される。
【0073】
図6に示すように、本出願の実施例に係る句読点予測方法の電子機器のブロックである。電子機械はラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム、及び他の適切なコンピュータなど、様々な形式のデジタルコンピュータを表すこと意図している。電子機械はさらに、様々な形態のモバイル装置、例えば、携帯情報端末、セルラー電話、スマートフォン、ウェアラブルデバイス及び他の同様なコンピューティングデバイスを表すことができる。本明細書に示されている部品、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本明細書で説明された及び/又は求められた本出願の実現を限定することを意図していない
【0074】
図6に示すように、該電子機械は、1つ又は複数のプロセッサ301、メモリ302、及び各部品を接続するためのインターフェースを含み、インターフェースは高速インターフェースと低速インターフェースを含む。各部品は、異なるバスを用いて互いに接続されており、かつ共用のマザーボードに実装されるか、又は必要に基づいて他の方式で実装されても良い。プロセッサは、電子機器内で実行される命令を処理することができ、前記命令は、外部入力/出力装置(例えば、インターフェースに接続される表示装置)にGUIの図形情報を表示するようにメモリ内又はメモリ上に記憶される命令を含む。他の実施形態において、必要があれば、複数のプロセッサ及び/又は複数のバスを複数のメモリと組み合わせて使用してもよい。同様に、複数の電子機器を接続してもよく、各機械は、必要とされる操作の一部(例えば、サーバアレイ、1組のブレードサーバ、又はマルチプロセッサシステムとして)を提供する。
図6では、1つのプロセッサ301は例として挙げられた。
【0075】
メモリ302は即ち本出願が提供する非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、前記少なくとも1つのプロセッサに本出願が提供する句読点予測方法を実行させるように、少なくとも1つのプロセッサによって実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本出願が提供する句読点予測方法を実行させることに用いられるコンピュータ命令が記憶されている。
【0076】
メモリ302は非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例に係る句読点予測方法に対応するプログラム命令/モジュール(例えば、図面5に示す取得モジュール110、入力モジュール120、第1の決定モジュール130、第2の決定モジュール140、句読点処理モジュール150)のような非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶することに用いることができる。プロセッサ301は、メモリ302に記憶される非一時的なソフトウェアプログラム、命令およびモジュールを実行することによって、サーバの機能適用およびデータ処理を実行し、即ち上記方法実施例の句読点予測方法を実行する。
【0077】
メモリ302は、プログラムを記憶する領域と、データを記憶する領域とを含んでも良い。プログラムを記憶する領域は、オペレーティングシステムと、少なくとも1つの機能に必要なアプリケーションプログラムを含んでも良い。データを記憶する領域は、句読点予測の電子機器の使用によって生成されたデータなどを記憶することができる。また、メモリ302は、高速ランダムアクセスメモリだけではなく、少なくとも1つのディスクストレージデバイス、フラッシュメモリデバイス又は他の非一時的なソリッドステートストレージデバイスのような非一時的なメモリを含んでも良い。一部の実施例では、メモリ302は、プロセッサ301に対してリモートで設定されるメモリを選択的に含んでもよく、これらのリモートメモリはネットワーク経由で句読点予測の電子機器に接続することができる。上記ネットワークの実例は、インターネット、企業内部のネットワーク、ローカルエリアネットワーク、移動通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
【0078】
句読点予測方法の電子機器は、入力装置303および出力装置304をさらに含んでも良い。プロセッサ301、メモリ302、入力装置303および出力装置304はバスまたは他の方式で接続することができ、
図6では、バスによる接続が例として挙げられている。
【0079】
入力装置303は、入力されたデジタル又は文字情報を受信する及び句読点予測の電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパネル、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティック等の入力装置がある。出力装置304は、表示装置、補助照明装置(例えば、LED)及び触覚フィードバック装置(例えば、振動モータ)などを含んでも良い。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含むが、これらに限定されない。一部の実施形態では、表示装置はタッチスクリーンであってもよい。
【0080】
本明細書で説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は以下を含んでもよい。1つ又は複数のコンピュータプログラムにおいて実施され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行及び/又は解釈することができ、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであり、ストレージシステム、少なくとも1つの入力装置及び少なくとも1つの出力装置からデータと命令を受信し、データ及び命令を該ストレージシステム、該少なくとも1つの入力装置及び該少なくとも1つの出力装置に転送することができる。
【0081】
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも言う)は、プログラマブルプロセッサの機械命令を含み、かつ高度プロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ言語/機械語を用いてこれらの計算プログラム実行することができる。本明細書で使用される「機械読み取り可能な媒体」と「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、装置、及び/又はデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するためのあらゆる信号を指す。
【0082】
ユーザとのインタラクションを提供するために、ここで説明されたシステムと技術をコンピュータ上で実施することができる。当該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)と、キーボードとポインティングデバイス(例えば、マウス又はトラックボール)とを含み、ユーザは該キーボードと該ポインティングデバイスを介して入力をコンピュータに提供することができる。別の種類のデバイスはさらにユーザとのインタラクションを提供することができ、例えば、ユーザに提供されたフィードバックは、任意の形式のセンサフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であっても良い以上、ユーザからの入力を任意の形式(音の入力、音声入力又は触覚入力を含む)で受信することもできる。
【0083】
ここで説明されたシステムと技術を、バックグラウンドパーツを含む計算システム(例えば、データサーバとして)、又はミドルウェアパーツを含む計算システム(例えば、アプリケーションサーバ)、又はフロントエンドパーツを含む計算システム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは該グラフィカルユーザインタフェース又は該ウェブブラウザ介して、ここで説明されたシステムと技術の実施形態と対話することができる)、又はこれらのバックグラウンドパーツ、ミドルウェアパーツ又はフロントエンドパーツの任意の組み合わせを含む計算システムにおいて実行することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)を介して、システムのパーツを互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットが含まれる。
【0084】
コンピュータシステムは、クライアント側とサーバを含んでも良い。クライアント側とサーバは通常離れており、一般的に通信ネットワークを介してインタラクションを行う。対応するコンピュータにおいて実行されかつ互いにクライアント側-サーバ関係を有するコンピュータプログラムによってクライアント側とサーバとの関係を生成する。
【0085】
なお、以上に示した様々な形式のプロセスを用いて、ステップを並べ替えたり、追加したり、削除したりすることができることを理解されたい。例えば、本出願書に記載の各ステップは、並列的に実行するか、順次的に実行するか、又は異なる順序で実行してもよい。本出願で開示された技術的解決手段が予期している結果を実現できる限り、本明細書では限定されない。
【0086】
上記具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者であれば、設計要件とその他の要因に応じて、様々な修正、組み合わせ、一部の組み合わせ及び置き換えを行うことができることを理解されたい。本出願の精神と原則を逸脱しない限り、行われるすべての修正、置き換え及び改善等は、いずれも本出願の保護範囲に含まれるべきである。