特許6543676 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ソフトバンクモバイル株式会社の特許一覧

特許6543676送信制御装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6543676

(24)【登録日】2019年6月21日

(45)【発行日】2019年7月10日

(54)【発明の名称】送信制御装置及びプログラム

(51)【国際特許分類】

G10L 15/28 20130101AFI20190628BHJP

G10L 15/32 20130101ALI20190628BHJP

G10L 15/30 20130101ALI20190628BHJP

G10L 15/10 20060101ALI20190628BHJP

【ＦＩ】

G10L15/28 230K

G10L15/32 220Z

G10L15/30

G10L15/10 200W

【請求項の数】5

【全頁数】14

(21)【出願番号】特願2017-211868(P2017-211868)

(22)【出願日】2017年11月1日

(65)【公開番号】特開2019-86535(P2019-86535A)

(43)【公開日】2019年6月6日

【審査請求日】2018年2月15日

(73)【特許権者】

【識別番号】501440684

【氏名又は名称】ソフトバンク株式会社

(74)【代理人】

【識別番号】110000877

【氏名又は名称】龍華国際特許業務法人

(72)【発明者】

【氏名】永井泰裕

(72)【発明者】

【氏名】湧川隆次

【審査官】千本潤介

(56)【参考文献】

【文献】特開２０１６−０９５３８３（ＪＰ，Ａ）

【文献】特開２０１６−１１４７４４（ＪＰ，Ａ）

【文献】特開２０１６−１５１６０８（ＪＰ，Ａ）

【文献】特開２０１３−０８８５３５（ＪＰ，Ａ）

【文献】特開２００２−１１６７９７（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１５／００−１７／２６

(57)【特許請求の範囲】

【請求項1】

マイクから入力された音声を取得する音声取得部と、
前記音声に予め定められた複数のウェイクワードのいずれかが含まれるかを判断する音声判断部と、
前記音声判断部が前記音声に第１ウェイクワードが含まれると判断した後に、当該判断後に前記マイクから入力された音声を示す音声データを、第１プラットフォームに送信させ、前記音声判断部が前記音声に前記第１ウェイクワードとは異なる第２ウェイクワードが含まれると判断した後に、当該判断後に前記マイクから入力された音声に応じた制御データを、外部デバイスに送信させる送信制御部と
を備え、
前記送信制御部は、前記音声判断部が前記音声に前記第２ウェイクワードが含まれると判断した後に、当該判断後に前記マイクから入力された音声に基づいて、前記制御データを特定できた場合に、前記制御データを前記外部デバイスに送信させ、前記制御データを特定できなかった場合に、前記音声データを前記第１プラットフォームとは異なる第２プラットフォームに送信させる、
送信制御装置。

【請求項2】

前記第１プラットフォームに送信された前記音声データに応答して、前記第１プラットフォームから送信された応答音声データが示す音声をスピーカに音声出力させる音声出力部
をさらに備える、請求項１に記載の送信制御装置。

【請求項3】

前記スピーカをさらに備える、請求項２に記載の送信制御装置。

【請求項4】

前記マイクをさらに備える、請求項１から３のいずれか一項に記載の送信制御装置。

【請求項5】

コンピュータを、請求項１から４のいずれか一項に記載の送信制御装置として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、送信制御装置及びプログラムに関する。

【背景技術】

【0002】

家庭等のユーザサイト内に配置され、マイクから入力されたユーザの音声をクラウドに送信して、クラウドによるサービスをユーザに提供する音声インタフェースデバイスが知られていた（例えば、特許文献１参照）。
［先行技術文献］
［特許文献］
［特許文献１］特表２０１４−５０７０３０号公報

【発明の概要】

【発明が解決しようとする課題】

【0003】

従来の音声インタフェースデバイスは、予め登録されたウェイクワードの発声を受け付けたことに応じて、その後の発声内容を予め定められた１つのクラウドサービスに送信する構成をとっており、ユーザに提供できるサービスがその１つのクラウドサービスに限定されていた。

【課題を解決するための手段】

【0004】

本発明の第１の態様によれば、送信制御装置が提供される。送信制御装置は、マイクから入力された音声を取得する音声取得部を備えてよい。送信制御装置は、音声に予め定められた複数のウェイクワードのいずれかが含まれるかを判断する音声判断部を備えてよい。送信制御装置は、音声判断部が音声に第１ウェイクワードが含まれると判断した後に、マイクから入力された音声を示す音声データを第１プラットフォームに送信させ、音声判断部が音声に前記第１ウェイクワードとは異なる第２ウェイクワードが含まれると判断した後に、マイクから入力された音声を示す音声データを第１プラットフォームとは異なる第２プラットフォームに送信させる送信制御部を備えてよい。

【0005】

上記送信制御部は、上記第１プラットフォームに送信された上記音声データに応答して上記第１プラットフォームから送信された制御データを、外部デバイスに送信させてよい。上記送信制御部は、上記音声判断部が上記音声に上記第１ウェイクワードが含まれると判断した場合に、当該判断後に上記マイクから入力される音声を示す音声データを送信する送信先を上記第１プラットフォームに設定し、上記音声判断部が上記音声に上記第２ウェイクワードが含まれると判断した場合に、当該判断後に上記マイクから入力される音声を示す音声データを送信する送信先を上記第２プラットフォームに設定してよく、上記送信制御装置は、上記送信制御部による設定に従って、上記マイクから入力された音声を示す音声データを送信するネットワークインタフェースを備えてよい。上記送信制御部は、上記音声判断部が、上記音声に上記複数のウェイクワードのいずれかが含まれると判断した場合に、上記マイクから入力される音声を示す音声を、上記音声判断部に送信せずに、上記ネットワークインタフェースに送信するよう、上記音声取得部を制御してよい。

【0006】

本発明の第２の態様によれば、送信制御装置が提供される。送信制御装置は、マイクから入力された音声を取得する音声取得部を備えてよい。送信制御装置は、音声に予め定められた複数のウェイクワードのいずれかが含まれるかを判断する音声判断部を備えてよい。送信制御装置は、音声判断部が音声に第１ウェイクワードが含まれると判断した後に、マイクから入力された音声を示す音声データを第１プラットフォームに送信させ、音声判断部が音声に第１ウェイクワードとは異なる第２ウェイクワードが含まれると判断した後に、マイクから入力された音声に応じた制御データを外部デバイスに送信させる送信制御部を備えてよい。

【0007】

上記送信制御部は、上記音声判断部が上記音声に上記第２ウェイクワードが含まれると判断した後に、上記マイクから入力された音声に基づいて上記制御データを特定できた場合に、上記制御データを上記外部デバイスに送信させ、上記制御データを特定できなかった場合に、上記音声データを上記第１プラットフォームとは異なる第２プラットフォームに送信させてよい。上記送信制御装置は、上記第１プラットフォームに送信された上記音声データに応答して、上記第１プラットフォームから送信された応答音声データが示す音声をスピーカに音声出力させる音声出力部をさらに備えてよい。上記送信制御装置は、上記スピーカをさらに備えてよい。上記送信制御装置は、上記マイクをさらに備えてよい。

【0008】

本発明の第３の態様によれば、コンピュータを、上記送信制御装置として機能させるためのプログラムが提供される。

【0009】

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

【図面の簡単な説明】

【0010】

【図1】システム１０の一例を概略的に示す。

【図2】システム１０の一例を概略的に示す。

【図3】システム１０の一例を概略的に示す。

【図4】送信制御装置１００の機能構成の一例を概略的に示す。

【図5】送信制御装置１００の機能構成の一例を概略的に示す。

【図6】コマンドテーブル３００の一例を概略的に示す。

【図7】プラットフォーム２１０の機能構成の一例を概略的に示す。

【図8】送信制御装置１００による処理の流れの一例を概略的に示す。

【図9】送信制御装置１００による処理の流れの一例を概略的に示す。

【図10】送信制御装置１００として機能するコンピュータ１０００のハードウエア構成の一例を概略的に示す。

【発明を実施するための形態】

【0011】

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

【0012】

図１は、システム１０の一例を概略的に示す。ここでは、システム１０は、送信制御装置１００と、プラットフォーム２１０及びプラットフォーム２２０とを有する。プラットフォーム２１０及びプラットフォーム２２０を区別しない場合、プラットフォーム２００と記載する場合がある。プラットフォーム２００は、いわゆるクラウドサービスを提供する提供主体であってよい。システム１０が有するプラットフォーム２００の数は２つに限らず、３つ以上であってもよい。

【0013】

送信制御装置１００は、家３０等の任意の場所に設置されて、ユーザ３２に対して音声インタフェースを提供する。送信制御装置１００は、例えば、ユーザ３２による音声の入力を受け付け、入力された音声を示す音声データを、ネットワーク５０を介してプラットフォーム２００に送信し、当該音声データに対する応答音声データを受信して、音声出力する。ネットワーク５０は任意のネットワークであってよく、例えば、インターネット及び電話網を含む。

【0014】

送信制御装置１００は、ホームアシスタント、スマートスピーカ、及びＡＩスピーカ等と称される装置であってよく、また、送信制御装置１００は、スマートフォン、タブレット端末、及びカーナビゲーション等であってもよい。送信制御装置１００は、これらの一部であってもよい。例えば、送信制御装置１００は、これらに搭載されているチップ及びモジュール等であってもよい。

【0015】

送信制御装置１００は、いわゆるウェイクワードが入力された場合に、その後に入力される音声を示す音声データをプラットフォーム２００に送信する。ウェイクワードは、ウェイクアップワード及びホットワード等と呼ばれる場合もある。

【0016】

送信制御装置１００は、ウェイクワードが入力された後、予め定められた時間が経過するまでの間に入力された音声を示す音声データを、入力されたウェイクワードに対応するプラットフォーム２００に送信してよい。この場合、ユーザ３２は、予め定められた時間が経過した後は、再度ウェイクワードを入力することになる。

【0017】

また、送信制御装置１００は、ウェイクワードが入力された後に入力された一回分の音声を示す音声データのみを、入力されたウェイクワードに対応するプラットフォーム２００に送信してもよい。この場合、ユーザ３２は、毎回ウェイクワードを入力することになる。

【0018】

また、送信制御装置１００は、ウェイクワードが入力された後、予め定められた条件が満たされるまでの間に入力された音声を示す音声データを、入力されたウェイクワードに対応するプラットフォーム２００に送信してもよい。予め定められた条件とは、例えば、終了を示す音声の入力を受け付けること等である。

【0019】

本実施形態に係る送信制御装置１００には、複数のプラットフォーム２００のそれぞれに対応する複数のウェイクワードが予め登録されてよい。ウェイクワードの登録は、任意のタイミングで行われてよい。例えば、ウェイクワードの登録は、送信制御装置１００の製造時に行われてよく、工場出荷時に行われてもよく、ユーザ３２が送信制御装置１００を入手してから使用するまでの間に行われてもよい。また、ウェイクワードは変更可能であってよい。

【0020】

図１に示す例では、プラットフォーム２１０に対応する第１ウェイクワードと、プラットフォーム２２０に対応する第２ウェイクワードとが、送信制御装置１００に登録される。１つのプラットフォーム２００に対応するウェイクワードは、複数であってもよい。

【0021】

送信制御装置１００は、ユーザ３２によって入力された音声に、複数のウェイクワードのいずれかが含まれるかを判断する。そして、送信制御装置１００は、複数のウェイクワードのいずれかが含まれると判断した場合、その後に入力された音声を示す音声データを、当該ウェイクワードに対応するプラットフォーム２００に対して送信する。例えば、送信制御装置１００は、第１ウェイクワードが含まれると判断した場合、その後に入力された音声を示す音声データをプラットフォーム２１０に送信する。また、送信制御装置１００は、第２ウェイクワードが含まれると判断した場合、その後に入力された音声を示す音声データをプラットフォーム２２０に送信する。

【0022】

このように、複数のプラットフォーム２００のそれぞれに対応する複数のウェイクワードを一の送信制御装置１００に実装することによって、接続するプラットフォーム２００を切り替え可能とすることにより、従来の音声インタフェースデバイスと比較して、機能を拡張し、利便性を向上させることができる。

【0023】

図２は、システム１０の他の一例を概略的に示す。図２に示す例では、送信制御装置１００は、送信制御装置１００の外部に位置する外部デバイス３６を制御可能である。外部デバイス３６は、通信機能を有する任意のデバイスであってよい。外部デバイス３６としては、テレビ、エアコン、電球及び冷蔵庫などの家電、ドアセンサ、並びに温度センサ等のＩｏＴ（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇ）デバイスが例示できる。

【0024】

例えば、送信制御装置１００は、入力された音声に第１ウェイクワードが含まれると判断した場合に、その後に入力された音声を示す音声データをプラットフォーム２１０に送信し、当該音声データに対する応答として、プラットフォーム２１０から、外部デバイス３６を制御するための制御データを受信する。制御データは、外部デバイス３６を制御することができればどのようなデータであってもよい。例えば、制御データは、外部デバイス３６を制御するための制御コマンドである。そして、送信制御装置１００は、受信した制御データを外部デバイス３６に送信することによって、外部デバイス３６を制御する。

【0025】

制御対象の外部デバイス３６がＡ社製のテレビであり、プラットフォーム２１０がＡ社によって提供されるプラットフォームである場合を例に挙げて、その具体例を説明する。ユーザ３２は、テレビを操作したい場合に、第１ウェイクワードを発声して、「テレビをつけて」等の操作内容を発声する。送信制御装置１００は、第１ウェイクワードの入力を受け付けたことにより、その後の音声を示す音声データの送信先をプラットフォーム２１０に設定して、入力された操作内容の音声を示す音声データをプラットフォーム２１０に送信する。プラットフォーム２１０は、受信した音声データを解析して、操作内容に対応する制御データを送信制御装置１００に送信する。そして、送信制御装置１００が、プラットフォーム２１０から受信した制御データをテレビに送信することによって、操作内容が実現される。このように、送信制御装置１００は、外部デバイス３６を間接的に制御してよい。

【0026】

また、送信制御装置１００は、外部デバイス３６を直接的に制御してもよい。例えば、送信制御装置１００に、外部デバイス３６に対応するウェイクワード（以下、ローカルウェイクワードと記載する。）が登録される。そして、送信制御装置１００は、入力された音声にローカルウェイクワードが含まれると判断した場合、その後に入力された音声に応じた制御データを、外部デバイス３６に送信する。例えば、制御対象の外部デバイス３６がテレビであり、ローカルウェイクワードの入力後に入力された音声が「テレビをつけて」であった場合は、テレビの電源をＯＮにする制御データがテレビに送信される。

【0027】

このように送信制御装置１００は、複数のウェイクワードによって、プラットフォーム２００の利用と、外部デバイス３６の制御とを切り替えてもよい。この場合、対象となるプラットフォーム２００の数は１つであっても複数であってもよく、対象となる外部デバイス３６の数も１つであっても複数であってもよい。

【0028】

外部デバイス３６に対応するウェイクワードとしては、複数の外部デバイス３６に対応するウェイクワードを登録してもよく、複数の外部デバイス３６のそれぞれに対応する複数のウェイクワードを登録してもよい。複数の外部デバイス３６に対応するウェイクワードを登録した場合、制御対象をどの外部デバイス３６にするかは、入力する音声の内容によって決定されてよい。例えば、制御対象の外部デバイス３６を指定する内容を含む音声を受け付け可能にしたり、制御の内容によって制御対象の外部デバイス３６を判定するようにしたりすることができる。

【0029】

送信制御装置１００から外部デバイス３６に対する制御データの送信は、任意の通信規格によって実現されてよい。通信規格としては、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＢＬＥ（Ｂｌｕｅｔｏｏｔｈ（登録商標）ＬｏｗＥｎｅｒｇｙ）、Ｚｉｇｂｅｅ（登録商標）、Ｚｗａｖｅ、ＬｏＲａ、及び赤外線通信等が例示できる。

【0030】

図３は、システム１０の他の一例を概略的に示す。図３に示す例では、プラットフォーム２００が、ルータ３４を介して外部デバイス３６を制御してよい。また、送信制御装置１００が、ルータ３４を介して外部デバイス３６を制御してもよい。

【0031】

例えば、送信制御装置１００は、入力された音声に第１ウェイクワードが含まれると判断した場合に、その後に入力された音声を示す音声データをプラットフォーム２１０に送信する。プラットフォーム２１０は、当該音声データに対する応答として、外部デバイス３６を制御するための制御データを、ルータ３４を介して外部デバイス３６に送信する。

【0032】

また、例えば、送信制御装置１００は、入力された音声に第１ウェイクワードが含まれると判断した場合に、その後に入力された音声を示す音声データをプラットフォーム２１０に送信し、当該音声データに対する応答として、プラットフォーム２１０から、外部デバイス３６を制御するための制御データを受信する。そして、送信制御装置１００は、受信した制御データを、ルータ３４を介して外部デバイス３６に送信する。

【0033】

なお、図３に示す例において、送信制御装置１００は、プラットフォーム２００と通信する場合に、ルータ３４を介して通信してもよく、ルータ３４を介さずに通信してもよい。

【0034】

図４は、送信制御装置１００の機能構成の一例を概略的に示す。送信制御装置１００は、マイク１０２、スピーカ１０４、音声取得部１１２、音声判断部１１４、送信制御部１１６、ネットワークインタフェース１１８、及び音声出力部１２０を備える。なお、送信制御装置１００がこれらのすべての構成を備えることは必須とは限らない。

【0035】

音声取得部１１２は、マイク１０２から入力された音声を取得する。音声取得部１１２が取得する音声は、アナログ信号であってよい。また、音声取得部１１２が取得する音声は、デジタル信号であってもよい。

【0036】

音声判断部１１４は、音声取得部１１２が取得した音声に予め定められた複数のウェイクワードのいずれかが含まれるかを判断する。音声判断部１１４は、いわゆる音声認識技術を利用して、音声にウェイクワードが含まれるかを判断してよい。

【0037】

例えば、音声判断部１１４は、ウェイクワードの音声波形を格納しておき、入力音声の音声波形とウェイクワードの音声波形とが合致していると判定した場合に、音声にウェイクワードが含まれると判断する。ウェイクワードの音声波形は、汎用的な音声波形であってよい。また、ウェイクワードの音声波形は、ユーザ３２によって登録されたユーザ３２によるウェイクワードの音声波形であってもよい。また、音声判断部１１４は、入力音声をテキスト化し、ウェイクワードのテキストと合致していると判定した場合に、音声にウェイクワードが含まれると判断してもよい。

【0038】

送信制御部１１６は、音声判断部１１４が入力音声に複数のウェイクワードのいずれかが含まれると判断した場合に、当該判断後にマイク１０２から入力された音声を示す音声データを、ウェイクワードに対応するプラットフォーム２００に送信させる。送信制御部１１６は、当該音声データをウェイクワードに対応するプラットフォーム２００に対して、ネットワークインタフェース１１８に送信させてよい。

【0039】

例えば、送信制御部１１６は、音声データの送信先をネットワークインタフェース１１８に設定する。また、送信制御部１１６は、マイク１０２から入力される音声をネットワークインタフェース１１８に送信するよう音声取得部１１２を制御してよい。これにより、入力音声に複数のウェイクワードのいずれかが含まれると判断された場合に、その後にマイク１０２に入力された音声が音声取得部１１２からネットワークインタフェース１１８に送信され、ネットワークインタフェース１１８は、設定に従って当該音声を示す音声データをプラットフォーム２００に送信する。

【0040】

なお、送信制御部１１６は、マイク１０２から入力される音声をネットワークインタフェース１１８に送信するとともに、マイク１０２から入力される音声を音声判断部１１４に送信しないように音声取得部１１２を制御してもよい。これにより、音声取得部１１２の処理量及び音声判断部１１４の処理量を適切に低減することができる。

【0041】

ネットワークインタフェース１１８は、プラットフォーム２００に送信した音声データに応答して、プラットフォーム２００から送信された応答音声データを受信した場合、当該応答音声データを音声出力部１２０に送信する。音声出力部１２０は、ネットワークインタフェース１１８から受信した応答音声データをスピーカ１０４に音声出力させる。

【0042】

送信制御部１１６は、プラットフォーム２００に送信した音声データに応答して、プラットフォーム２００から送信された制御データを受信した場合、ネットワークインタフェース１１８に、当該制御データを外部デバイス３６に送信させてよい。ネットワークインタフェース１１８は、制御データを直接外部デバイス３６に送信してもよく、また、ルータ３４を介して外部デバイス３６に送信してもよい。

【0043】

図５は、送信制御装置１００の機能構成の一例を概略的に示す。送信制御装置１００は、マイク１０２、スピーカ１０４、音声取得部１１２、音声判断部１１４、送信制御部１１６、ネットワークインタフェース１１８、音声出力部１２０、及びコマンド処理部１３０を備える。なお、送信制御装置１００がこれらのすべての構成を備えることは必須とは限らない。ここでは、図４に示す送信制御装置１００と異なる点を主に説明する。

【0044】

送信制御部１１６は、音声判断部１１４が、マイク１０２から入力された音声にプラットフォーム２００に対応するウェイクワードが含まれると判断した場合、当該判断後にマイク１０２から入力された音声を示す音声データを、ウェイクワードに対応するプラットフォーム２００に送信させる。送信制御部１１６は、入力音声にプラットフォーム２００に対応するウェイクワードが含まれると判断した場合、当該判断後にマイク１０２から入力される音声をネットワークインタフェース１１８に送信するよう音声取得部１１２を制御してよい。

【0045】

送信制御部１１６は、音声判断部１１４が、マイク１０２から入力された音声にローカルウェイクワードが含まれると判断した場合、当該判断後にマイク１０２から入力された音声に応じた制御データを外部デバイス３６に送信させる。ここで、送信制御部１１６は、入力音声にローカルウェイクワードが含まれると判断された場合、当該判断後にマイク１０２から入力される音声をコマンド処理部１３０に送信するよう音声取得部１１２を制御してよい。

【0046】

コマンド処理部１３０は、音声取得部１１２から受信した音声によって、複数の制御データのうちのいずれかを特定することができるかを判断する。コマンド処理部１３０は、例えば、複数の制御データのそれぞれに対応する音声波形を格納しておき、受信した音声が、複数の音声波形のいずれかに合致すると判定した場合、制御データを特定できたと判断し、いずれにも合致しないと判定した場合、制御データを特定できなかったと判断する。また、コマンド処理部１３０は、受信した音声をテキスト化して、複数の制御データのそれぞれを表すテキストのいずれかに合致すると判定した場合、制御データを特定できたと判断し、いずれにも合致しないと判定した場合、制御データを特定できなかったと判断してもよい。

【0047】

コマンド処理部１３０は、制御データを特定できた場合、特定した制御データを、外部デバイス３６に対してネットワークインタフェース１１８に送信させてよい。コマンド処理部１３０は、制御データを特定できなかった場合、音声取得部１１２から受信した音声を示す音声データを、ローカルウェイクワードに対応するプラットフォーム２００に対して、ネットワークインタフェース１１８に送信させてよい。

【0048】

図６は、制御コマンドテーブル３００の一例を概略的に示す。制御コマンドテーブル３００は、登録デバイス欄３０２、接続先アドレス欄３０４、対応操作欄３０６、操作対応音声データ欄３０８、及びコマンド欄３１０を含む。

【0049】

登録デバイス欄３０２には、制御対象のデバイスを識別する情報が登録される。接続先アドレス欄３０４には、接続先となる制御対象のデバイスのアドレスが登録される。アドレスは、ＩＰアドレス及びＭＡＣアドレス等、制御対象のデバイスを特定することができればどのようなアドレスであってもよい。

【0050】

対応操作欄３０６には、制御対象のデバイスに対する操作内容が登録される。操作対応音声データ欄３０８には、対応操作欄３０６に登録された操作内容に対応する音声データが登録される。音声データとしては、音声波形が登録されてよい。コマンド欄３１０には、対応操作欄３０６に登録された操作内容を、制御対象のデバイスに実行させるためのコマンドが登録される。

【0051】

図７は、プラットフォーム２００の機能構成の一例を概略的に示す。プラットフォーム２００は、音声認識エンジン２５２、アプリケーションインタフェース部２５４、音声合成エンジン２５６、及びアプリケーション群２６０を備える。

【0052】

音声認識エンジン２５２は、送信制御装置１００から受信した音声データに音声認識処理を施して、音声データをテキストデータに変換する。音声認識エンジン２５２は、変換したテキストデータをアプリケーションインタフェース部２５４に送信する。

【0053】

アプリケーションインタフェース部２５４は、音声認識エンジン２５２から受信したテキストデータの解析結果に基づいて、アプリケーション群２６０からアプリケーション２６２を選択し、選択したアプリケーション２６２に対してリクエストを送信する。リクエストを受信したアプリケーション２６２は、リクエストに対するレスポンスをアプリケーションインタフェース部２５４に送信する。アプリケーションインタフェース部２５４は、受信したレスポンスを音声合成エンジン２５６に送信する。

【0054】

音声合成エンジン２５６は、アプリケーションインタフェース部２５４から受信したレスポンスに音声合成処理を施して、音声データを生成する。そして、音声合成エンジン２５６は、生成した音声データを送信制御装置１００に送信する。

【0055】

アプリケーションインタフェース部２５４から受信したリクエストに対して、アプリケーション２６２が、外部デバイス３６を制御する制御データをアプリケーションインタフェース部２５４に送信した場合、アプリケーションインタフェース部２５４は、当該制御データを送信制御装置１００又は外部デバイス３６に対して送信してよい。また、アプリケーション２６２が、アプリケーションインタフェース部２５４を介さずに、制御データを送信制御装置１００又は外部デバイス３６に対して送信してもよい。

【0056】

図８は、送信制御装置１００による処理の流れの一例を概略的に示す。図８に示す処理は、プラットフォーム２１０に対応する第１ウェイクワード及びプラットフォーム２２０に対応する第２ウェイクワードが登録されている状態で、送信制御部１１６が送信先を設定するまでの処理の流れを示す。図８に示す各処理は、送信制御装置１００が備える制御部が主体となって実行される。

【0057】

ステップ１０２（ステップをＳと省略して記載する場合がある。）では、音声取得部１１２が、マイク１０２から入力された音声を取得する。Ｓ１０４では、音声判断部１１４が、Ｓ１０２において取得された音声に第１ウェイクワードが含まれるか否かを判断する。含まれると判断された場合、Ｓ１０６に進み、含まれないと判断された場合、Ｓ１０８に進む。Ｓ１０６では、送信制御部１１６が、音声データの送信先をプラットフォーム２１０に設定する。

【0058】

Ｓ１０８では、音声判断部１１４が、Ｓ１０２において取得された音声に第２ウェイクワードが含まれるか否かを判断する。含まれると判断された場合、Ｓ１１０に進み、含まれないと判断された場合、Ｓ１０２に戻る。Ｓ１１０では、送信制御部１１６が、音声データの送信先をプラットフォーム２２０に設定する。そして、処理を終了する。

【0059】

図９は、送信制御装置１００による処理の流れの一例を概略的に示す。図９に示す処理は、プラットフォーム２１０に対応する第１ウェイクワード及びローカルウェイクワードが登録されており、かつ、ローカルウェイクワードに対してプラットフォーム２２０が対応付けられている状態で、送信制御装置１００が音声の入力を受け付けた場合の処理の流れを示す。図９に示す各処理は、送信制御装置１００が備える制御部が主体となって実行される。

【0060】

Ｓ２０２では、音声取得部１１２が、マイク１０２から入力された音声を取得する。Ｓ２０４では、音声判断部１１４が、Ｓ２０２において取得された音声に第１ウェイクワードが含まれるか否かを判断する。含まれると判断された場合、Ｓ２０６に進み、含まれないと判断された場合、Ｓ２０８に進む。Ｓ２０６では、送信制御部１１６が、第１ウェイクワードの入力後に入力された音声を示す音声データをネットワークインタフェース１１８に、プラットフォーム２１０に対して送信させる。

【0061】

Ｓ２０８では、音声判断部１１４が、Ｓ２０２において取得された音声にローカルウェイクワードが含まれるか否かを判断する。含まれると判断された場合、Ｓ２１０に進み、含まれないと判断された場合、Ｓ２０２に戻る。Ｓ２１０では、コマンド処理部１３０が、ローカルウェイクワードの入力後に入力された音声に基づいて制御データを特定できるかを判断する。特定できると判断された場合、Ｓ２１２に進み、特定できないと判断された場合、Ｓ２１４に進む。

【0062】

Ｓ２１２では、コマンド処理部１３０によって特定された制御データを、ネットワークインタフェース１１８が外部デバイス３６に対して送信する。Ｓ２１４では、ネットワークインタフェース１１８が、ローカルウェイクワードの入力後に入力された音声を示す音声データをプラットフォーム２２０に送信する。

【0063】

Ｓ２１６では、終了指示が有ったか否かを判定する。終了指示がなかったと判定された場合、Ｓ２０２に戻り、終了指示があったと判定された場合、処理を終了する。

【0064】

図１０は、送信制御装置１００として機能するコンピュータ１０００の一例を概略的に示す。本実施形態に係るコンピュータ１０００は、ホストコントローラ１０９２により相互に接続されるＣＰＵ１０１０、及びＲＡＭ１０３０を有するＣＰＵ周辺部と、入出力コントローラ１０９４によりホストコントローラ１０９２に接続されるＲＯＭ１０２０、通信Ｉ／Ｆ１０４０、ハードディスクドライブ１０５０、及び入出力チップ１０８０を有する入出力部を備える。

【0065】

ＣＰＵ１０１０は、ＲＯＭ１０２０及びＲＡＭ１０３０に格納されたプログラムに基づいて動作し、各部の制御を行う。通信Ｉ／Ｆ１０４０は、有線又は無線によりネットワークを介して他の装置と通信する。また、通信Ｉ／Ｆ１０４０は、通信を行うハードウエアとして機能する。ハードディスクドライブ１０５０は、ＣＰＵ１０１０が使用するプログラム及びデータを格納する。

【0066】

ＲＯＭ１０２０は、コンピュータ１０００が起動時に実行するブート・プログラム及びコンピュータ１０００のハードウエアに依存するプログラムなどを格納する。入出力チップ１０８０は、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポートなどを介して各種の入出力装置を入出力コントローラ１０９４へと接続する。

【0067】

ＲＡＭ１０３０を介してハードディスクドライブ１０５０に提供されるプログラムは、ＩＣカードなどの記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、ＲＡＭ１０３０を介してハードディスクドライブ１０５０にインストールされ、ＣＰＵ１０１０において実行される。

【0068】

コンピュータ１０００にインストールされ、コンピュータ１０００を送信制御装置１００として機能させるプログラムは、ＣＰＵ１０１０などに働きかけて、コンピュータ１０００を、送信制御装置１００の各部としてそれぞれ機能させてよい。これらのプログラムに記述された情報処理は、コンピュータ１０００に読込まれることにより、ソフトウエアと上述した各種のハードウエア資源とが協働した具体的手段である音声取得部１１２、音声判断部１１４、送信制御部１１６、音声出力部１２０、及びコマンド処理部１３０として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ１０００の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の送信制御装置１００が構築される。

【0069】

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

【0070】

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

【符号の説明】

【0071】

１０システム、３０家、３２ユーザ、３４ルータ、３６外部デバイス、５０ネットワーク、１００送信制御装置、１０２マイク、１０４スピーカ、１１２音声取得部、１１４音声判断部、１１６送信制御部、１１８ネットワークインタフェース、１２０音声出力部、１３０コマンド処理部、２００プラットフォーム、２１０プラットフォーム、２２０プラットフォーム、２５２音声認識エンジン、２５４アプリケーションインタフェース部、２５６音声合成エンジン、２６０アプリケーション群、２６２アプリケーション、３００コマンドテーブル、３０２登録デバイス欄、３０４接続先アドレス欄、３０６対応操作欄、３０８操作対応音声データ欄、３１０コマンド欄、１０００コンピュータ、１０１０ＣＰＵ、１０２０ＲＯＭ、１０３０ＲＡＭ、１０４０通信Ｉ／Ｆ、１０５０ハードディスクドライブ、１０８０入出力チップ、１０９２ホストコントローラ、１０９４入出力コントローラ

【図1】