(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
本出願の実施の形態は、通信ソフトウェアにおいて音声により業務を起動する方法及びこれに対応する装置を提供する。
【0015】
当業者が本出願の技術的解決をより深く理解できるように、本出願の実施の形態において、添付図面を参照しつつ、本出願の実施の形態における技術的解決を明瞭かつ完全に以下で説明する。説明する実施の形態は、本出願の実施の形態のすべてではなく、その一部であることは明らかである。本出願の実施の形態に基づいて当業者が創造的な努力をせずに導き出されたすべての実施の形態は何れも本出願の保護範囲内に含まれるものとする。
【0016】
図1は、本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する方法のフローチャートである。この方法は、支払い業務などの業務を音声によって起動するために、インスタントメッセージングに適用できる。支払い業務とは、具体的に、別のユーザなどへの送金又は支払いであってよい。
【0017】
具体的に、
図1に示す実施の形態の方法は下記のステップを含んでよい。
ステップ101:ユーザが通信ソフトウェアを用いて別の一人と通信する際に、ユーザが入力した音声情報を収集する。
ステップ102:音声情報を認識し、音声情報に特定のコマンドが含まれていれば、これに対応する業務を起動する。
ステップ103:業務処理装置に当該業務を処理させるために、業務情報と、取引データを含む情報とを業務処理装置へ送信する。
【0018】
この実施の形態は、インスタントメッセージングシステムに適用でき、このシステムは携帯電話、タブレットコンピュータ、コンピュータのようなユーザ端末を含んでよい。このシステムは、インスタントメッセージングサーバをさらに含んでもよい。各ユーザは、自分の端末を使ってインスタントメッセージングサーバにアカウントを登録し、ユーザ間でインスタントメッセージングを実施できる。インスタントメッセージングシステムはQQ、Wechat、Laiwangなどであってよい。通信ソフトウェアは、具体的には、QQソフトウェア、Wechatアプリケーション、Laiwangアプリケーションなどであってよい。
【0019】
この実施の形態では、ステップ102からステップ103はユーザ端末によって実行されてよく、具体的には、ユーザ端末が、インスタントメッセージングにてユーザの音声情報を収集することで対応の業務を起動し、この業務を業務処理装置へ送信して処理する。本明細書において、業務処理装置は、具体的にはインスタントメッセージングサーバであってよい。あるいは、ユーザ端末が、インスタントメッセージングサーバを介して別体の業務処理装置へ業務を送信することであってもよい。
【0020】
本出願の一の実施の形態として、この方法は、ユーザが正規ユーザであるかどうか認証するステップをさらに含む。ユーザが正規ユーザであるかを認証するこのステップは、ユーザが通信ソフトウェアを開始する時に実施できる。ユーザが正規ユーザである場合に、ユーザは通信ソフトウェアの使用を許可され、正規ユーザでない場合には、ユーザは通信ソフトウェアの使用を拒否される。さらに、今、音声情報を入力しているユーザが正規ユーザであるかどうかを認証してもよく、これは、通信ソフトウェアの開始後に相対する側への送信のための情報を入力するユーザが正規ユーザであるかどうかの認証を含んでもよく、又は、特定のコマンドを入力しているユーザが正規ユーザであるかの認証を含んでもよい。以降に示す、ユーザが正規ユーザであるかどうかを認証する方法は、個別に又は組み合わせて用いることができる。
【0021】
本出願の一の実施の形態として、ユーザが正規ユーザかどうかを認証するステップは、具体的に、ユーザが正規ユーザかどうかを、ユーザの入力操作を認証することにより、又は、ユーザの生体特徴を認証することにより判定するステップを含んでよい。
【0022】
本出願の一の実施の形態として、入力操作は、ユーザが入力した文字列で形成されたパスワード、ユーザのスライド入力、ユーザによるキー押しの組み合わせのうち少なくとも1つを含む。
【0023】
本出願の一の実施の形態として、生体特徴は、ユーザの指紋、ユーザの顔画像、ユーザの声紋のうち少なくとも1つを含む。
【0024】
本出願の一の実施の形態として、ユーザが正規ユーザであるかどうかを、ユーザの音声を認証することで判定するステップは、ユーザが正規ユーザであるかどうかを声紋認識によって認証するステップを含む。
【0025】
本出願の一の実施の形態として、音声情報を認識するステップは、音声情報に含まれる取引データを認識するステップをさらに含む。
【0026】
本出願の一の実施の形態として、業務情報と、取引データを含む情報とを業務処理装置へ送信するステップは、業務情報と取引データとを業務処理装置へ送信するステップをさらに含む。
【0027】
本出願の一の実施の形態として、業務情報と、取引データを含む情報とを業務処理装置へ送信するステップは、業務情報と音声情報とを業務処理装置へ送信するステップをさらに含む。
【0028】
本出願の一の実施の形態として、業務情報と、取引データを含む情報とを受信した後に、業務装置は、業務オーダーのようなオーダー(命令)情報をさらに生成し、これをユーザ端末へ戻してもよい。業務オーダーは、音声情報に従って業務処理装置により認識された業務情報と取引データとを含んでよい。
【0029】
本出願の一の実施の形態として、業務情報は業務IDと、通信ソフトウェアを介して通信している様々な参加ユーザの識別子とを少なくとも含む。
【0030】
上で述べた本出願の実施の形態の方法により、ユーザ端末上の通信ソフトウェアにおいて音声により業務を起動する解決策を追加することで、ユーザがチャット中に金銭取引業務を開始できるようになる。ユーザは、チャットインターフェースを終えて複雑なクリック操作を実行することなく金銭取引業務を使用できるため、ユーザにとって複雑な操作は著しく単純化され、これによりユーザはさらに優れたユーザエクスペリエンスを体験できる。さらに、金銭取引業務を開始する音声情報の声紋認識によれば、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を使って金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
【0031】
図2は、本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動する方法のフローチャートである。
ステップ201:ユーザ端末から送信された業務情報と、取引データを含む情報とを受信する。
ステップ202:業務情報と、取引データを含む情報とに基づいて業務を処理する。
【0032】
本出願の一の実施の形態として、取引データを含む情報は音声情報であり、この方法は、音声情報中の取引データを認識するステップをさらに含む。
【0033】
本出願の一の実施の形態として、ユーザ端末が送信した業務情報と、取引データを含む情報とを受信するステップは、その業務情報と取引データを含む情報とを、今送信しているユーザが、正規ユーザであるかどうかを認証するステップをさらに含む。
【0034】
本出願の一の実施の形態として、ユーザが正規ユーザであるかどうかは、ユーザ端末から送信された音声情報に声紋認識を実施することで判定される。
【0035】
本出願の一の実施の形態として、業務情報は、業務IDと、通信ソフトウェアを介して通信している様々な参加ユーザの識別子とを少なくとも含む。業務情報と、取引データを含む情報とを受信すると、業務装置は業務を処理して業務オーダーなどのオーダー(命令)情報を形成し、これを、業務に関与している複数のユーザ端末へ戻す。業務は支払業務を含んでよく、支払業務とは具体的には別のユーザへの送金又は支払などの業務であってよい。
【0036】
上で述べた本出願の実施の形態の方法によれば、ユーザ端末上で音声機能により起動された業務情報を受信することで、チャットサービスをユーザに提供する工程中に金銭取引業務への応答を行うことができる。ユーザは、チャットインターフェースを終えてから複雑なクリック操作を実行することなく金銭取引業務を使用できるので、ユーザにとって複雑な操作は著しく単純化され、よって、ユーザはより優れたユーザエクスペリエンスを体験できる。さらに、金銭取引業務を開始する音声情報の声紋認識により、金銭取引業務を開始するユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を用いて金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
【0037】
図3は、本出願による、通信ソフトウェアにおいて音声により業務を起動する装置の概略の構造図である。
【0038】
この装置は、ユーザが通信ソフトウェアを用いて別の人と通信する場合に、ユーザが入力した音声情報を収集するように構成された収集ユニット301と;
音声情報を認識し、音声情報が特定のコマンドを含む場合には、対応する業務を起動するように構成されたコマンド認識ユニット302と;
業務装置が業務を処理できるように、業務情報と、取引データを含む情報とを業務処理装置へ送信するように構成された送信ユニット303とを備える。
【0039】
本出願の一の実施の形態として、この装置は、業務処理装置から送信された業務オーダーを受信するように構成された受信ユニット304をさらに含む。
【0040】
本出願の一の実施の形態として、この装置は、ユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット305をさらに含む。ユーザが正規ユーザであるかどうかを認証ユニットが認証する特定のステップについては、
図1に示す実施の形態の方法を参照できるため、ここでは繰り返さない。
【0041】
本出願の一の実施の形態として、認証ユニット305は、ユーザが正規ユーザであるかどうかを声紋認識によって認証する。
【0042】
この実施の形態では、受信ユニット及び送信ユニットが、携帯電話(又は、タブレットコンピュータのようなインテリジェント端末)のWiFiモジュール、GPRS、又は3G、4Gネットワークを用いてデータの送受信を行うことができる。収集ユニットは携帯電話(又は、タブレットコンピュータのようなインテリジェント端末)のマイクロフォンであってよい。コマンド認識ユニットは、従来技術の音声認識モジュールを用いて、音声中の特定の言葉を認識することにより特定のコマンドを認識できる。認証ユニットは、次のようなユーザの入力操作によってユーザの正当性を認証することができる。例えば、仮想キーボード(又は物理的キーボード)をクリックすることによる認証情報の入力、スライディングによる認証情報の入力、指紋認識モジュールなどの生体特徴認識モジュールを用いた指紋入力情報の認証、マイクロフォン及び声紋認識モジュールを用いた音声入力情報の認証、カメラ及び人物顔認識モジュールを用いた人物顔のアバターの入力情報の認証。
【0043】
上で述べた本出願の実施の形態の装置により、ユーザ端末上の通信ソフトウェアにおいて音声により業務を起動する解決法を追加することで、ユーザはチャット中に金銭取引業務を開始することができる。ユーザは、チャットインターフェースを終えて複雑なクリック操作を実行することなく金銭取引業務を行えるので、ユーザにとって複雑な操作が著しく単純化され、これによりユーザはより優れたユーザエクスペリエンスを体験することができる。さらに、金銭取引業務を開始する音声情報の声紋認識により、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を用いて金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
【0044】
図4は、本出願の一の実施の形態による、業務処理装置の概略の構造図である。
【0045】
この装置は、ユーザ端末から送信された業務情報と、取引データを含む情報とを受信するように構成された受信ユニット401と、業務を業務情報と、取引データを含む情報とに基づいて処理するように構成された処理ユニット402とを含む。
【0046】
本出願の一の実施の形態として、装置は、取引データを含む情報が音声情報である場合に、この音声情報中の取引データを認識するように構成された音声認識ユニット403をさらに含む。
【0047】
本出願の一の実施の形態として、装置は、業務情報と、取引データを含む情報とを今送信しているユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット404をさらに含む。
【0048】
本出願の一の実施の形態として、認証ユニット404は、ユーザが正規ユーザであるかどうかを、ユーザ端末から送信された音声情報に声紋認識を実施することで判定するように構成された声紋認識ユニットである。
【0049】
この実施の形態では、受信ユニットは、例えばイーサネット(登録商標)接続デバイスなどを含むコンピュータの通信ユニットであってよい。コンピュータのCPU、特定の設定をしたDSP、シングルチップマイクロコンピュータのようなデバイスを用いて、オーダー生成ユニットを実現することができる。音声認識ユニットは音声認識モジュールを用いて実現できる。音声認識モジュールは従来技術の音声認識アルゴリズムを使用できるため、ここでは説明を繰り返さない。認証ユニットは、受信した文字列を事前に記憶されている認証情報と比較することによって、認証目的を達成できる。例えば、認証ユニットは、ユーザ端末から送信され、受信した文字列認証情報を、事前に記憶されている認証情報と比較するか、受信した生体特徴を、事前に記憶されている認証情報と比較することで、認証目的を達成できる。例えば、認証ユニットは、ユーザ端末から受信した指紋情報を事前に記憶されている指紋認証情報と比較するか、ユーザ端末から受信した音声情報を事前に記憶されている声紋認証情報と比較するか、又は、ユーザ端末から受信した人物顔のアバター情報を事前に記憶されている人物顔認証情報と比較する。
【0050】
上で述べた本出願の実施の形態の装置によれば、ユーザ端末上で音声機能により起動した業務情報を受信することで、チャットサービスをユーザに提供する工程中に金銭取引業務への応答を行うことができる。ユーザは、チャットインターフェースを終えてから複雑なクリック操作を実行しなくても金銭取引業務を行えるため、ユーザにとって複雑な操作が著しく単純化され、これによりユーザは一層優れたユーザエクスペリエンスを体験することができる。さらに、金銭取引業務を開始する音声情報の声紋認識により、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を使って金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
【0051】
図5は、本出願の一の実施の形態による、通信ソフトウェアにおいて音声により業務を起動するデータフロー図である。この実施の形態を特定のアプリケーションのシナリオを例にして説明する。この実施の形態は、通信ソフトウェアを介してチャット中のユーザ端末A及びユーザ端末Bと、ユーザ端末が開始した業務を対応処理する業務処理装置とを含む。ユーザ端末Aとユーザ端末Bは、携帯電話、タブレットコンピュータ、コンピュータなどを含んでよい。通信ソフトウェアはQQソフトウェア、Wechatアプリケーション、Laiwangアプリケーションなどであってよい。当然ながら、別の実施の形態では、チャット通信状態にあるユーザ端末数はさらに多くてよい。
【0052】
ステップ501:ユーザ端末Aがユーザ端末Bとの間のチャット通信を実施する。
通信はテキスト式チャット通信又は音声式通信を含んでよい。ここで、音声式通信とは、チャットソフトウェアにおいてユーザが音声でショートメッセージを入力して送信するチャット通信方式を指す。
【0053】
ステップ502:ユーザ端末Aは、ユーザが入力した音声情報を、マイクロフォンを介して収集する。
このステップで収集される音声情報はチャット内容と特定の指示を含んでよい。例えば、ユーザ端末Aが携帯電話のマイクロフォンを使って音声情報「こんにちは」を入力し、これをユーザ端末Bへ送信すると、ユーザ端末Bが音声情報で「こんにちは」と応答し、次に、ユーザ端末Aがマイクロフォンを介して「全能なるAlipay集金、あなたに100元請求したい」と入力する。音声情報は特定コマンド「全能なるAlipay集金」と、取引データ「あなたに100元請求したい」を含んでいる。
【0054】
ステップ503:ユーザ端末Aのコマンド認識ユニットが、ユーザが入力した全ての音声情報を認識する。
音声認識にはユーザ端末A内の音声認識モジュールを使えるので、ここでは説明を繰り返さない。
【0055】
ステップ504:認識した音声情報に特定コマンドが含まれているかどうかを判定し、特定コマンドが含まれている場合にはステップ505を、特定コマンドが含まれていない場合にはステップ506を実行する。
この実施例では、ユーザ端末Aが、ユーザが入力した音声情報「こんにちは」には特定コマンドが含まれていないと認識し、ステップ506を実行して音声情報をチャット内容として通常送信する。ユーザが入力した「全能なるAlipay集金、あなたに100元請求したい」には、特定コマンド「全能なるAlipay集金」が含まれている。当然ながら、別の実施の形態では、特定コマンドは、一般的なチャット音声情報と違ったものである限り、これとは別のものであってよい。
【0056】
ステップ505:入力された音声情報に声紋認識を実施し、この声紋認識が成功した場合にはステップ507を、失敗した場合にはステップ508を実行する。
このステップでは、ユーザは、比較的正確な声紋モデルを取得する前に、携帯電話の声紋認識のトレーニングを実行する。声紋モデルは、隠れマルコフモデル(HMM)、ガウス混合モデル(GMM)、サポートベクターマシン(SVM)などであってよい。次に、実行中の音声情報に声紋認識を実施する。例えば、現在業務を開始しているユーザが正規ユーザであるかどうかを確認するために、「全能なるAlipay集金」を声紋モデルと照合する。こうすることで、従来技術で発生した、携帯電話を別の人が用いた場合に、取引を開始した友人への金銭取引によって金銭損失が生じる可能性を回避できる。一方で、ユーザが声紋情報をアップロードしたサーバが攻撃されて情報漏洩が生じた場合にユーザの個人情報が漏洩してしまう問題を回避するために、手元の携帯電話で声紋認識を実施する。
【0057】
当然ながら、別の実施の形態では、このステップでユーザが正規ユーザであるかどうかを認証することは、ユーザがユーザ端末Aのタッチ画面又はキーボード上でパスワードを入力することでさらに代用でき(又は、例えば、電源キーと音量下げキーを同時に押すなどの、キーを組み合わせて押すこともパスワードとしてさらに使用できる)、パスワードが正確である場合にのみ、実行中の業務が正規ユーザによって開始されていると証明できる。あるいは、例えば、ユーザ端末Aのタッチ画面上で指によるスライド操作を用いることで、スライド操作の進路が所定の進路であれば、実行中の業務が正規ユーザによって開始されたものであると証明できる。同様に、さらに指紋認識方式を用いてもよい。既存の携帯電話の多くは指紋認識ユニットを設けており、ユーザが指紋認識ユニットに圧力をかけたり指紋認識ユニットで指紋サンプルを取ったりすると、その指紋は事前に記憶されている指紋と比較される。比較結果が一致した場合は、実行中の業務が正規ユーザによって開始されたと証明される。別の例として、現在、業務を開始しているユーザが正規ユーザであるかどうかを、携帯電話のカメラで現在のユーザの人物顔画像を採取し、人物顔認識を実施することによってもさらに認証できる。これ以外にも多くの認証方法を利用できるが、本出願では説明を繰り返さない。
【0058】
別の実施の形態として、このステップの声紋認識(又は、その他の認証方法)を業務処理装置においても実施できる。この場合には、業務処理装置へ事前に声紋サンプルデータベース(又は、別の認証方法で必要な対応データ)を設定しておくことができる。業務要求が送信されると、リモートエンドでユーザを認証するために、音声情報又は別の認証方法で必要なデータが業務処理装置へ送信される。
【0059】
上で述べた実施の形態から分かるように、声紋を使った認識は好ましい実施の形態である。なぜなら、ユーザが音声情報(すなわち、特定コマンド及び取引データを含んでいる)を入力している間にユーザ正当性の認証を実行することが可能であり、ユーザはさらなる認証情報を再び入力する必要がないので、ユーザは対応の業務をより便宜的かつ迅速に起動させることができ、これによりユーザエクスペリエンスが向上するからである。
【0060】
他の実施の形態では、ユーザの正当性の認証をさらにステップ501の前又は後に設定するか、あるいは同時に実行することもできる。この認証は、ユーザが通信ソフトウェアを開始するときに実行されるため、ユーザの正当性が保証される。あるいは、この認証は、ユーザAがユーザBとチャット通信を実施するときに実行することもできる。例えば、チャットソフトウェアの使用工程中にチャット目的で音声ショートメッセージが入力された際に、ユーザの正当性を認証するために声紋認識が実施される。あるいは、別のステップにおいて認証を行ってもよい。例えば、特定のコマンドが含まれているかどうかを判定するために、ユーザが入力した音声情報に音声認識を実施する工程において、声紋認識を実施してユーザの正当性を認証する。この認証方法については先の説明で包括的に述べており、異なる点は認証のタイミングだけであることから、ここでは認証方法についての説明を繰り返さない。
【0061】
ステップ506:チャット内容としての音声情報を通常送信する。
【0062】
ステップ507:集金業務モジュールを開始して、業務処理装置への集金業務要求を開始する。
このステップでは、集金業務要求は業務情報と音声情報を含む。業務情報は、業務ID(集金業務を表す)と、チャット通信における異なる参加ユーザ識別子(ユーザ端末A及びユーザ端末Bのユーザの一意識別子、又はSIMカードの一意識別子など)を含む。音声情報は「全能なるAlipay集金、あなたに100元請求したい」を含み、音声情報は取引データ「あなたに100元請求したい」を含む。
【0063】
ステップ508:エラー情報がユーザに対して表示され、集金業務モジュールは開始されない。
【0064】
ステップ509:業務処理装置がユーザ端末Aから送信された集金業務要求を構文解析する。
業務情報から、現在処理対象である業務(業務IDに従って取得)、この業務に関与するユーザ(ユーザ識別子を介して取得)、音声情報が取得される。
【0065】
ステップ510:音声情報に含まれている取引データを取得するために、音声情報に音声認識を実施する。
このステップでは、音声情報に含まれている取引データを取得するために、音声認識ユニットを用いて音声情報に認識を実施してもよい。高性能コンピュータを用いて構成された業務処理装置は、比較的正確な音声認識結果を提供することができる、言い換えれば、音声情報中の正確な取引データを取得することができる。
【0066】
この実施例では、認識される取引データは「あなたに100元請求したい」である。実行中の通信の意味解析及びユーザ識別子によって、支払先はユーザ端末A、支払元はユーザ端末B、取引金額は100元であることが判定される。
【0067】
ステップ511:業務を処理し、業務オーダーを生成し、この業務オーダーを業務に関係しているユーザ端末Aとユーザ端末Bに送信する。
業務ID及び業務に関与するユーザに従って、また、取引データに従って対応の業務を処理し、業務オーダーを生成して、この集金業務に関わる双方に送信する。ユーザ端末Aに送信する業務オーダーは通知であり、ユーザ端末Bに送信する業務オーダーは支払要求である。ユーザ端末Bは、従来技術の業務工程に従って支払操作を実行してもよい。
【0068】
図6は、本出願の一の実施の形態による、通信ソフトウェアにて音声で業務を起動する別のデータフロー図である。
【0069】
この実施の形態は、通信ソフトウェアを用いてチャット中のユーザ端末A、ユーザ端末B、ユーザ端末Cと、これらユーザ端末が開始した業務を対応処理するように構成された業務処理装置とを含む。
【0070】
ステップ601において、ユーザ端末A、ユーザ端末B、ユーザ端末Cがチャット通信を実施する。
【0071】
ステップ602:ユーザ端末Aは、ユーザが入力した音声情報を、マイクロフォンを介して収集する。
この実施の形態では、
図5に示す実施の形態と同一の内容については説明を繰り返さない。このステップにおいて、特定の指示を含む音声情報は「全能なるAlipay集金、ユーザ端末Cに100元を支払いたい」である。
【0072】
ステップ603:ユーザ端末Aのコマンド認識ユニットが、ユーザが入力した全ての音声情報を認識する。
このステップでは、音声情報「全能なるAlipay集金、ユーザ端末Cに100元を支払いたい」が完全に認識される。言い換えれば、特定の指示「全能なるAlipay集金」が認識されるだけでなく、取引データ「ユーザ端末Cに100元を支払いたい」も認識される。実行中の通信の意味解析及びユーザ識別子によって次の取得データが取得される。支払元はユーザ端末A、支払先はユーザ端末C、取引金額は100元である。
【0073】
ステップ604:認識された音声情報が特定コマンドを含んでいるかどうかを判定し、特定コマンドを含む場合にはステップ605を、含まない場合にはステップ606を実行する。
【0074】
ステップ605:入力された音声情報に声紋認識を実施し、声紋認識が成功した場合にはステップ607を、失敗した場合にはステップ608を実行する。
このステップでは、ユーザ正当性の認証を声紋認識によって行うが、これは
図5に示す実施の形態のようなその他の認証方法を用いて実施してもよいため、ここでは説明を繰り返さない。
【0075】
さらに、このステップでのユーザ正当性の認証は、業務処理装置内で実施してもよい。この場合には、ユーザ正当性の認証に必要なデータが業務処理装置へ送信される必要がある。
【0076】
ステップ607:業務処理装置への支払業務要求を開始するために、支払業務モジュールを開始する。
このステップでは、支払業務要求が業務情報と取引データとを含む。業務情報は業務ID(集金業務を表す)と、チャット通信の各参加者のユーザ識別子(ユーザ端末A、ユーザ端末B、ユーザ端末C)とを含む。取引データは、支払元がユーザ端末Aであり、支払先がユーザ端末Cであり、取引金額が100元である。
【0077】
ステップ608:エラー情報がユーザに対して表示され、支払業務モジュールは開始されない。
【0078】
ステップ609:業務処理装置が、ユーザ端末Aが送信した集金業務要求を構文解析する。
業務情報から現在処理対象である業務(業務IDに従って取得)が取得され、また、取引データから、支払元がユーザ端末Aであり、支払先がユーザ端末Cであり、取引金額が100元であることが取得される。すでに音声認識をユーザ端末Aで実施しているので、このステップでの構文解析に音声認識は不要であり、また、ユーザ端末Aから送信された支払業務要求は文字形式の業務情報と取引データとを含む。
【0079】
ステップ610:業務処理装置は業務を処理し、業務オーダーを生成して、これを当該の業務に関連するユーザ端末Aとユーザ端末Cに送信する。
業務オーダーは業務ID及び業務に関与するユーザに従って、また、取引データに従って生成される。業務オーダーは支払業務に関わる双方に送信される。ユーザ端末Aに送信される業務オーダーは支払要求であり、ユーザ端末Aは従来技術の業務工程に従って支払操作を実行してもよい。ユーザ端末Cに送信される業務オーダーは集金通知である。
【0080】
上で述べた本出願の実施の形態における方法及び装置によって、ユーザ端末にて音声機能で起動することにより、ユーザにチャットサービスを提供している工程中に、金銭取引業務に対する応答を行うことができる。ユーザは、チャットインターフェースを終えて複雑なクリック操作を実行することなく金銭取引業務を行えるので、ユーザにとって複雑な操作は著しく単純化され、これによりユーザは一層優れたユーザエクスペリエンスを体験することができる。さらに、金銭取引業務を開始する音声情報の声紋認識によれば、金銭取引業務を開始しているユーザが正規ユーザであると確信できるので、別の人がインテリジェント端末を使って金銭取引業務を開始する危険要因を回避できる。一方で、同一の音声情報を認証に用いることができ(取引指示と声紋認証内容の両方)、ユーザは本出願の方法をより便利に使えるようになる。
【0081】
技術の向上は、ハードウェアの改良(例えば、ダイオード、トランジスタ、スイッチのような回路構造の改良)、又はソフトウェアの改良(方法手順の改良)として明確に区別できる。しかし、技術の開発に伴い、現在、多くの方法手順の改良はハードウェア回路構造の直接の改良とみなされ得る。ほぼ全ての設計者は、改良した方法手順をハードウェア回路に組み込むことで、この方法手順に対応したハードウェア回路構造を得ている。そのため、方法手順はハードウェアエンティティ(実体)モジュールを用いて改良することができないと仮定することは不可能である。例えば、プログラマブル論理デバイス(PLD)(例えば、フィールドプログラマブルゲートアレイ(FPGA))はこのような集積回路であり、その論理機能はユーザプログラミングデバイスによって決定される。設計者は、専用の集積回路チップ2の設計及び製造をチップメーカに依頼するのではなく、デジタルシステムを1つのPLDの中に統合するよう独自でプログラムする。さらに、現在、プログラミングは、集積回路チップを手作業で製造するのではなく、ほとんどが「論理コンパイラ」ソフトウェアを用いて実施されている。このソフトウェアは、プログラムの開発及び書き込みに使用されるソフトウェアコンパイラと類似しており、また、コンパイリング前のオリジナルコードはハードウェア記述言語(HDL)と呼ばれる特定のプログラミング言語で書かれている必要がある。HDLには、ABEL(Advanced Boolean Expression Language)、AHDL(アルテラハードウェア記述言語:Altera Hardware Description Language)、Confluence、CUPL(コーネル大学プログラミング言語:Cornell University Programming Language)、HDCal、JHDL(Java(登録商標)ハードウェア記述言語:Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Rubyハードウェア記述言語:Ruby Hardware Description Language)など種々あり、中でも、VHDL(超高速集積回路ハードウェア記述言語:Very-High-Speed Integrated Circuit Hardware Description Language)とVerilog2が現在最も一般的に使用されている。当業者は、上で述べたいくつかのハードウェア記述言語を用いて方法手順を論理的にプログラミングし、これを集積回路に組み込むことで、論理方法手順を実施するためのハードウェア回路を容易に得られることも熟知しているはずである。
【0082】
制御装置は任意の適切な方法で実現できる。例えば、制御装置はマイクロプロセッサ又はプロセッサ、コンピュータ読取り可能な媒体の形態であってよく、コンピュータ読取り可能な媒体は、(マイクロ)プロセッサ、論理ゲート、スイッチ、特定用途向け集積回路(ASIC)、プログラマブル論理制御装置、埋込型マイクロコントローラによって実行可能な、コンピュータ読取り可能なプログラムコード(例えばソフトウェア又はファームウェア)を記憶する。制御装置の例は次のマイクロコントローラを非限定的に含む。ARC625D、Atmel AT91SAM、Microchip PIC18F26K20、Silicone Labs C8051F320。メモリ制御装置をメモリの制御論理の一部として実現してもよい。
【0083】
当業者は、制御装置を純粋なコンピュータ読取り可能なプログラムコードを用いて実現するだけでなく、制御装置に、論理ゲート、スイッチ、特定用途向け集積回路、プログラマブル論理制御装置、埋込型マイクロコントローラの形態にて同じ機能を実施させるよう、方法ステップを論理的にプログラムできることも熟知している。したがって、このような制御装置はハードウェアコンポーネントとみなすことができ、また、制御装置に内蔵され、様々な機能を実施するように構成された装置もハードウェアコンポーネント内部の構造体とみなすことができる。あるいは、様々な機能を実施するように構成された装置は、方法を実施するためのソフトウェアモジュールと、ハードウェアコンポーネント内の構造体の両方、とみなすこともできる。
【0084】
上記の実施の形態で例証したシステム、装置、モジュール又はユニットは、具体的には、コンピュータチップ又はエンティティ(実体)、もしくは、特定の機能を持った製品を用いて実現することができる。
【0085】
説明を容易にするために、前述の装置を、機能に関連した種々のユニットに分割して説明した。本出願を実施する際には、種々のユニットの機能は、同一もしくは複数のソフトウェア及び/又はハードウェアで実施できることは明らかである。
【0086】
上で述べた実施方法の説明に基づき、当業者は、本出願がソフトウェア及び必要なユニバーサルハードウェアプラットフォームで実施できることを明確に理解できる。この理解に基づき、本質的な本出願の技術的解決、又は従来技術に寄与する部分は、ソフトウェア製品の形態で実施され得る。このソフトウェア製品は、ROM/RAM、磁気ディスク、又は光学ディスクのような記憶媒体に記憶できる。また、このソフトウェア製品は、コンピュータデバイス(パーソナルコンピュータ、サーバ、ネットワークデバイスなどであってよい)に本出願の実施の形態又は実施の形態の特定部分に記載の方法を実行させることが可能ないくつかのインストラクション(命令、指示)を含んでいる。
【0087】
本明細書の実施の形態は段階的に説明されており、種々の実施の形態の同一又は類似の部分は相互参照によって得られ、それぞれの実施の形態は他の実施の形態とは異なる部分を強調している。特に、システムの実施の形態は方法の実施の形態と基本的に類似するので、説明は簡単である。関連部分については、方法の実施の形態における該当部分の説明を参照されたい。
【0088】
本出願は様々な汎用(ユニバーサル)又は専用のコンピュータシステム環境又は構成に適用できる。例えば、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルド型機器又はポータブル機器、タブレット機器、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、プログラム可能な家電用電子デバイス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、及び上記の任意のシステム又は機器を含む分散コンピューティング環境である。
【0089】
本出願は、プログラムモジュールなど、コンピュータによって実行されるコンピュータで実行可能なインストラクション(命令、指示)の一般的な文脈内において記述され得る。一般に、プログラムモジュールは、特定タスクの実行又は特定の抽象データ型の実装のための、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。本出願は分散コンピューティング環境でも実施することができ、分散コンピューティング環境では、タスクは、通信ネットワークを介して接続されているリモート処理デバイスを用いて実行される。分散コンピューティング環境では、プログラムモジュールは記憶装置を含むローカル及びリモートのコンピュータ記憶媒体内に配置されてよい。
【0090】
本出願を実施の形態によって説明したが、当業者は、本出願の精神から逸脱せずに本出願に多くの変形及び変更を加えることが可能であり、これらの変形及び変更は、本出願の精神から逸脱せずに添付する特許請求の範囲に含まれるものであることを理解するはずである。
[第1の局面]
通信ソフトウェアにおいて音声により業務を起動する方法であって:
ユーザが通信ソフトウェアを用いて別の人と通信する際に、前記ユーザが入力した音声情報を収集するステップと;
前記音声情報を認識し、前記音声情報が特定コマンドを含む場合には、対応する業務を起動するステップと;
業務処理装置が前記業務を処理できるようにするために、業務情報と、取引データを含む情報とを前記業務処理装置へ送信するステップと;を備える、
通信ソフトウェアにおいて音声により業務を起動する方法。
[第2の局面]
前記ユーザが正規ユーザであるかどうかを認証するステップ;をさらに備える、
第1の局面に記載の方法。
[第3の局面]
前記ユーザが正規ユーザであるかどうかを認証する前記ステップは、前記ユーザが正規ユーザであるかどうかを、前記ユーザの入力操作を認証することによって、又は、前記ユーザの生体特徴を認証することによって判定するステップ;をさらに備える、
第2の局面に記載の方法。
[第4の局面]
現在音声情報を入力している前記ユーザが正規ユーザであるかどうかを認証する前記ステップは、声紋認識によって認証される、
第2の局面に記載の方法。
[第5の局面]
前記音声情報が認識されると、前記音声情報内に含まれている取引データがさらに認識される、
第1の局面に記載の方法。
[第6の局面]
業務情報と、取引データを含む情報とを業務処理装置へ送信する前記ステップは、具体的に、前記業務情報と前記取引データとを前記業務処理装置へ送信するステップ;を備える、
第5の局面に記載の方法。
[第7の局面]
業務情報と、取引データを含む情報とを業務処理装置へ送信する前記ステップは、具体的に、前記業務情報と前記音声情報とを前記業務処理装置へ送信するステップ;を備え、
前記音声情報は、取引データを含む、
第1の局面に記載の方法。
[第8の局面]
前記業務情報は、業務IDと、前記通信ソフトウェアを介して通信している様々な参加ユーザの識別子とを少なくとも含む、
第1の局面に記載の方法。
[第9の局面]
業務情報と、取引データを含む情報とを業務処理装置へ送信する前記ステップの後に、前記方法は、前記業務処理装置から送信された業務オーダーを受信するステップ;をさらに備える、
第1の局面に記載の方法。
[第10の局面]
通信ソフトウェアにおいて音声により業務を起動する方法であって:
ユーザ端末から送信された業務情報と、取引データを含む情報とを受信するステップと;
前記業務情報と、前記取引データを含む情報とに基づいて業務を処理するステップと;を備える、
通信ソフトウェアにおいて音声により業務を起動する方法。
[第11の局面]
前記取引データを含む情報は、音声情報であり、
前記方法は、前記音声情報中の前記取引データを認識するステップ;をさらに備える、
第10の局面に記載の方法。
[第12の局面]
ユーザ端末から送信された、前記業務情報と、前記取引データを含む情報とを受信するステップは、前記業務情報と、前記取引データを含む情報とを現在送信しているユーザが正規ユーザであるかどうかを認証するステップ;をさらに備える、
第10の局面に記載の方法。
[第13の局面]
前記ユーザが正規ユーザであるかどうかは、前記ユーザ端末から送信された前記音声情報に声紋認識を実施することにより判定される、
第12の局面に記載の方法。
[第14の局面]
前記業務情報は、業務IDと、前記通信ソフトウェアを介して通信している様々な参加ユーザの識別子と;を少なくとも備える、
第10の局面に記載の方法。
[第15の局面]
通信ソフトウェアにおいて音声により業務を起動する装置であって:
ユーザが通信ソフトウェアを用いて別の人と通信する場合に、前記ユーザが入力した音声情報を収集するように構成された収集ユニットと;
前記音声情報を認識し、前記音声情報が特定コマンドを含む場合には、対応する業務を起動するように構成されたコマンド認識ユニットと;
業務処理装置が前記業務を処理できるように、業務情報と、取引データを含む情報とを前記業務処理装置へ送信するように構成された送信ユニットと;を備える、
通信ソフトウェアにおいて音声により業務を起動する装置。
[第16の局面]
前記ユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット;をさらに備える、
第15の局面に記載の装置。
[第17の局面]
前記認証ユニットは、前記ユーザが正規ユーザであるかどうかを声紋認識によって認証する、
第16の局面に記載の装置。
[第18の局面]
前記業務処理装置から送信された業務オーダーを受信するように構成された受信ユニット;をさらに備える、
第15の局面に記載の装置。
[第19の局面]
業務処理装置であって:
ユーザ端末から送信された業務情報と取引データを含む情報とを受信するように構成された受信ユニットと;
前記業務情報と取引データを含む情報とに基づいて業務を処理するように構成された処理ユニットと;を備える、
業務処理装置。
[第20の局面]
前記取引データを含む情報が音声情報である場合に、前記音声情報中の前記取引データを認識するように構成された音声認識ユニット;をさらに備える、
第19の局面に記載の装置。
[第21の局面]
前記業務情報と、前記取引データを含む情報とを現在送信しているユーザが正規ユーザであるかどうかを認証するように構成された認証ユニット;をさらに備える、
第19の局面に記載の装置。
[第22の局面]
前記認証ユニットは、前記ユーザが正規ユーザであるかどうかを、前記ユーザ端末から送信された前記音声情報に声紋認識を実施することで判定するように構成された声紋認識ユニットである、
第21の局面に記載の装置。