特許第6468069号(P6468069)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オンキヨー株式会社の特許一覧

特許6468069電子機器制御システム、サーバー、及び、端末装置
<>
  • 特許6468069-電子機器制御システム、サーバー、及び、端末装置 図000002
  • 特許6468069-電子機器制御システム、サーバー、及び、端末装置 図000003
  • 特許6468069-電子機器制御システム、サーバー、及び、端末装置 図000004
  • 特許6468069-電子機器制御システム、サーバー、及び、端末装置 図000005
  • 特許6468069-電子機器制御システム、サーバー、及び、端末装置 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6468069
(24)【登録日】2019年1月25日
(45)【発行日】2019年2月13日
(54)【発明の名称】電子機器制御システム、サーバー、及び、端末装置
(51)【国際特許分類】
   G10L 15/30 20130101AFI20190204BHJP
   G10L 15/32 20130101ALI20190204BHJP
   G10L 15/10 20060101ALI20190204BHJP
   G10L 15/00 20130101ALN20190204BHJP
【FI】
   G10L15/30
   G10L15/32 220B
   G10L15/10 200W
   !G10L15/00 200A
【請求項の数】5
【全頁数】10
(21)【出願番号】特願2015-101611(P2015-101611)
(22)【出願日】2015年5月19日
(65)【公開番号】特開2016-218200(P2016-218200A)
(43)【公開日】2016年12月22日
【審査請求日】2018年1月30日
(73)【特許権者】
【識別番号】710014351
【氏名又は名称】オンキヨー株式会社
(72)【発明者】
【氏名】近藤 裕介
【審査官】 大野 弘
(56)【参考文献】
【文献】 特開2014−182307(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/30
G10L 15/10
G10L 15/32
G10L 15/00
(57)【特許請求の範囲】
【請求項1】
音声データに対応する発音情報を送信する外部サーバーと通信を行うサーバーと、前記サーバーと通信を行う端末装置と、を備える電子機器制御システムであって、
前記端末装置は、
外部の音声を集音し音声データとして出力するマイクと、
前記マイクが出力する音声データをサーバーに送信する第1制御部と、を備え、
前記サーバーは、
電子機器に記憶されているオーディオデータに関するタグ情報と、タグ情報に対応する発音情報と、を対応付けて記憶するための記憶部と、
前記端末装置が送信する音声データを受信し、
受信した音声データを前記外部サーバーに送信し、
送信した音声データに対応する発音情報を前記外部サーバーから受信し、
受信した発音情報と、前記記憶部に記憶されている発音情報と、に基づいて、タグ情報を決定し、
決定したタグ情報とともに、制御コマンドを前記電子機器に送信する第2制御部と、
を備えることを特徴とする電子機器制御システム。
【請求項2】
前記第2制御部は、タグ情報を発音情報に変換し、タグ情報と、変換した発音情報と、を対応付けて前記記憶部に記憶することを特徴とする請求項1に記載の電子機器制御システム。
【請求項3】
前記第2制御部は、前記電子機器から送信されるタグ情報を受信し、受信したタグ情報を発音情報に変換し、受信したタグ情報と、変換した発音情報と、を対応付けて前記記憶部に記憶することを特徴とする請求項1に記載の電子機器制御システム。
【請求項4】
請求項1〜3のいずれか1項に記載のサーバー。
【請求項5】
請求項1〜3のいずれか1項に記載の端末装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スマートフォン等の電子機器を制御するための電子機器制御システム、電子機器制御システムを構成するサーバー、及び、端末装置に関する。
【背景技術】
【0002】
近年、ユーザーが発話した音声を利用して、スマートフォン等の電子機器を制御する技術が開発されている(例えば、特許文献1参照。)。図5は、従来の電子機器制御システムのシステム構成を示す図である。電子機器制御システム11は、端末装置12、ホームサーバー13、ルーター14を備える。電子機器制御システム11において、ユーザーは、端末装置11に対して発話することにより、スマートフォン15からオーディオデータを再生することができる。端末装置11は、ユーザーが発話した音声を集音し音声データをホームサーバー13に送信する。ホームサーバー13は、音声認識機能を有しており、端末装置12が送信した音声データを音声認識する。
【0003】
音声認識率を高めるため、ホームサーバー13には、スマートフォン15に記憶されているオーディオデータに関するタグ情報(テキスト情報)が記憶されている。タグ情報は、アーティスト名、アルバム、タイトル等である。ここで、タグ情報は、アルファベット(例えば、Beatles)であったり、カタカナ(例えば、ビートルズ)であったりする場合がある。このため、ホームサーバー13は、タグ情報を発音情報(例えば、bi.tA.r6u-.zu-)に変換し、変換した発音情報を記憶している。また、ホームサーバー13は、端末装置12が送信した音声データを発音情報に変換する。これにより、ホームサーバー13は、記憶している発音情報と、変換した発音情報と、を比較することで、例えば、ユーザーが発話したアーティスト名を特定することができる。
【0004】
ホームサーバー13は、タグ情報(例えば、アーティスト名)と制御コマンド(例えば、プレイ)とをスマートフォン15に送信する。スマートフォン15は、ホームサーバー13が送信したタグ情報と制御コマンドとに従って、オーディオデータを再生する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2013−088535号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記した従来の電子機器制御システム11では、ホームサーバー13が音声認識機能を有している。音声認識機能では、音声認識辞書(タグ情報)と音声認識エンジンとがセットになっている。このため、ホームサーバー13に音声認識エンジンを実装した場合、ホームサーバー13に大きなプロセッサパワーが必要となり、単価が上昇するという問題がある。また、外部のクラウドサーバーで音声認識を行うため、タグ情報をクラウドサーバーに送信することが考えられる。しかし、タグ情報は、スマートフォン15のユーザー毎に異なるため、ユーザー毎の管理が必要である。また、タグ情報を扱うことの許諾をユーザーから得る必要がある。
【0007】
本発明の目的は、電子機器制御システムにおいて、サーバーの単価を抑制すること等である。
【課題を解決するための手段】
【0008】
第1の発明の電子機器制御システムは、音声データに対応する発音情報を送信する外部サーバーと通信を行うサーバーと、前記サーバーと通信を行う端末装置と、を備える電子機器制御システムであって、前記端末装置は、外部の音声を集音し音声データとして出力するマイクと、前記マイクが出力する音声データをサーバーに送信する第1制御部と、を備え、前記サーバーは、電子機器に記憶されているオーディオデータに関するタグ情報と、タグ情報に対応する発音情報と、を対応付けて記憶するための記憶部と、前記端末装置が送信する音声データを受信し、受信した音声データを前記外部サーバーに送信し、送信した音声データに対応する発音情報を前記外部サーバーから受信し、受信した発音情報と、前記記憶部に記憶されている発音情報と、に基づいて、タグ情報を決定し、決定したタグ情報とともに、制御コマンドを前記電子機器に送信する第2制御部と、を備えることを特徴とする。
【0009】
本発明では、第2制御部は、受信した発音情報と、記憶部に記憶されている発音情報と、に基づいて、タグ情報を決定する。例えば、第2制御部は、タグ情報として、アーティスト名を決定する。そして、第2制御部は、決定したタグ情報とともに、制御コマンドを電子機器に送信する。例えば、第2制御部は、決定したアーティスト名とともに、制御コマンド「プレイ」を電子機器に送信する。電子機器は、アーティスト名と制御コマンド「プレイ」により、対応するアーティスト名の楽曲を再生することができる。本発明では、サーバーは、音声認識を行わず、外部サーバーで音声認識を行うため、サーバーのプロセッサパワーが少なくてよい。このため、サーバーの単価を抑えることができる。
【0010】
また、外部サーバーがタグ情報を扱わないため、ユーザー毎に異なるタグ情報の管理が不要になる。また、タグ情報を扱うことの許諾をユーザーから得ることが不要となる。
【0011】
第2の発明の電子機器制御システムは、第1の発明の電子機器制御システムにおいて、前記第2制御部は、タグ情報を発音情報に変換し、タグ情報と、変換した発音情報と、を対応付けて前記記憶部に記憶することを特徴とする。
【0012】
本発明では、第2制御部は、タグ情報を発音情報に変換し、タグ情報と、変換した発音情報と、を対応付けて記憶部に記憶する。これにより、タグ情報を外部サーバー等に送信する必要がないため、外部とやり取りするデータ量が多くなることが防止される。
【0013】
第3の発明の電子機器制御システムは、第1の発明の電子機器制御システムにおいて、前記第2制御部は、前記電子機器から送信されるタグ情報を受信し、受信したタグ情報を発音情報に変換し、受信したタグ情報と、変換した発音情報と、を対応付けて前記記憶部に記憶することを特徴とする。
【0014】
第4の発明のサーバーは、第1〜第3の発明のいずれかの電子機器制御システムにおけるサーバーである。
【0015】
第5の発明の端末装置は、第1〜第3の発明のいずれかの電子機器制御システムにおける端末装置である。
【発明の効果】
【0016】
本発明によれば、サーバーの単価を抑えることができる。また、ユーザー毎に異なるタグ情報の管理が不要になる。また、タグ情報を扱うことの許諾をユーザーから得ることが不要となる。
【図面の簡単な説明】
【0017】
図1】本発明の実施形態に係る電子機器制御システムのシステム構成を示す図である。
図2】音声認識キーワードデータベースを示す図である。
図3】電子機器制御システムの動作を示すシーケンス図である。
図4】音声認識キーワードデータベースからキーワードを抽出する、ホームサーバーのフィルタ処理を示すフローチャートである。
図5】従来の電子機器制御システムのシステム構成を示す図である。
【発明を実施するための形態】
【0018】
以下、本発明の実施形態について説明する。図1は、本実施形態に係る電子機器制御システムの構成を示すブロック図である。電子機器制御システム1は、端末装置2、ホームサーバー3、クラウドサーバー4、ルーター5を備える。クラウドサーバー4は、外部に設置された外部サーバーである。端末装置2は、ホームサーバー3と通信を行う。ホームサーバー3は、クラウドサーバー4と通信を行う。本実施形態では、制御対象の電子機器は、スマートフォン6である。
【0019】
端末装置2は、マイクロコンピュータ21、マイク22、スピーカー23等を備える。マイクロコンピュータ21(第1制御部)は、端末装置2を構成する各部を制御する。また、マイクロコンピュータ21は、無線LANネットワークプロセッサーを有しており、ルーター5と無線LANに従った通信を行う。マイク22は、外部の音声を集音し音声データとして出力する。マイク22が出力した音声データは、図示しないDSP(Digital Signal Processor)を介して、マイクロコンピュータ21に入力される。なお、マイク22は、デジタルマイクであり、集音した音声データをA/D変換してDSPに出力する。スピーカー23は、音声データに基づいて音声を出力する。なお、スピーカー23には、図示しないD/Aコンバータが音声データ(デジタルデータ)をD/A変換し、図示しないパワーアンプが増幅した音声データが出力される。
【0020】
ホームサーバー3(サーバー)は、CPU(Central Processing Unit)31、RAM(Random Access Memory)32、記憶部33、ネットワークインターフェース(以下、「NW I/F」という。)34を備える。CPU31(第2制御部)は、ホームサーバー3を構成する各部を制御する。RAM32は、CPU31のワークメモリとして機能する。記憶部33は、各種のプログラム、データを記憶するためのものである。また、記憶部33には、音声認識キーワードデータベース(以下、「音声認識キーワードDB」という。)が記憶されている。NW I/F34は、外部の機器(例えば、ルーター5)と有線LAN、無線LANに従った通信を行うためのものである。
【0021】
ルーター5は、アクセスポイント機能を有しており、端末装置2、スマートフォン6と無線LANに従った通信を行う。また、ルーター5は、ホームサーバー3と有線LANに従った通信を行う。また、ルーター5は、ホームサーバー3とクラウドサーバー4とをインターネット接続する。
【0022】
クラウドサーバー4(外部サーバー)は、音声認識機能を有する。クラウドサーバー4は、音声認識機能により、音声データを音声コマンドと発音情報とに変換する。スマートフォン5には、音楽再生アプリケーションプログラム(以下、「音楽再生アプリ」という。)Pがインストールされている。
【0023】
図2は、音声認識キーワードDBを示す図である。スマートフォン6は、音楽再生アプリPの初回起動時に、音声認識キーワードDBに登録されるタグ情報等をリストとして送信する。音声認識キーワードDBにおいては、アクセサリー(Accessory)「スマートフォン(Smart Phone)」の「アプリケーション名(Application Name)」として、「音楽プレイヤー(Music Player)」が登録されている。これに対応する単語として、「Music Player」が登録されている。また、プロファイル(Profile)「音楽再生(MusicPlay)」に対応する単語として、「Music」、「音楽」等が登録されている。
【0024】
また、「アクション(Action)」の「再生(Play)」に対応する単語として、「Play」、「再生」、「一時停止(Pause)」に対応する単語として、「Pause」、「一時停止」等が登録されている。また、「ターゲット(Target)」の「アーティスト(Artist)」に対応する単語として、「Artist」、「歌手」、「タイトル(Title)」に対応する単語として、「Title」、「題名」が登録されている。また、音声認識キーワードDBには、アーティスト名等のタグ情報と、タグ情報に対応する発音情報と、が対応付けて登録されている。ホームサーバー3のCPU31は、NW I/F34を介して、スマートフォン6から送信されるタグ情報を受信すると、タグ情報を発音情報に変換する。そして、CPU31は、受信したタグ情報(例えば、「Beatles」)と、変換した発音情報(例えば、「bi.tA.r6u-.zu-」)と、を対応付けて音声認識キーワードDBに登録する。
【0025】
図3は、電子機器制御システムの動作を示すシーケンス図である。以下、図3に基づいて、スマートフォン6を制御する一連の動作を説明する。まず、ユーザーは、スマートフォン6にインストールされている音楽再生アプリPを起動する(図3の(1))。音楽再生アプリPが起動されると、スマートフォン6は、タグ情報等をリストとしてホームサーバー3に送信する(図3の(2))。ホームサーバー3のCPU31は、NW I/F34を介して、タグ情報等を受信すると、音声認識キーワードDBに登録する(図3の(3))。
【0026】
ユーザーは、端末装置2がホームサーバー3に音声データを送信するデータ送信モードとするために、所定のキーワードを発話する。本実施形態では、端末装置2は、所定のキーワードにより、データ送信モードに遷移する。例えば、ユーザーは、所定のキーワードとして、「こんにちはオンキヨー」と発話する(図3の(4))。次に、例えば、ユーザーは、ビートルズの楽曲を再生したい場合、「Play Beatles」と発話する(図3の(5))。端末装置2のマイク22は、ユーザーが発話した音声を集音し音声データとしてマイクロコンピュータ21に出力する。マイクロコンピュータ21は、音声データ(「Play Beatles」)をホームサーバー3に送信する(図3の(6))。ホームサーバー3のCPU31は、NW I/F34を介して、端末装置2が送信した音声データを受信する。次に、CPU31は、NW I/F34を介して、クラウドサーバー4に音声データを送信し、クラウドサーバー4に音声認識を要求する(図3の(7))。
【0027】
クラウドサーバー4は、ホームサーバー3が送信した音声データを受信する。クラウドサーバー4は、音声認識機能を有しており、音声データを音声コマンド(例えば、「Play」)と、発音情報(例えば、「bi.tA.r6u-.zu-」)と、に変換する。次に、クラウドサーバー4は、変換した音声コマンドと、発音情報と、をホームサーバー3に送信し、音声認識の結果を応答する(図3の(8))。ホームサーバー3のCPU31は、NW I/F34を介して、クラウドサーバー4が送信した音声コマンドを受信する。CPU31は、音声認識結果の解析を行う(図3の(9))。具体的には、CPU31は、音声認識キーワードDBに登録されている登録単語と、受信した音声コマンドと、に基づいて、音声コマンド(例えば、「Play」)に対応する制御コマンド(例えば、「Play」)を決定する。また、CPU31は、受信した発音情報(例えば、「bi.tA.r6u-.zu-」)と、音声認識キーワードDBに登録されている発音情報(例えば、「bi.tA.r6u-.zu-」)と、に基づいて、タグ情報(例えば、「Beatles」)を決定する。
【0028】
次に、CPU31は、NW I/F34を介して、決定した制御コマンドと、タグ情報と、をスマートフォン6に送信する(図3の(10))。スマートフォン6は、ホームサーバー3から送信される制御コマンドと、タグ情報と、を受信する。スマートフォン6は、制御コマンドと、タグ情報と、に従って、オーディオデータ(例えば、ビートルズの楽曲)を再生する(図3の(11))。次に、スマートフォン6は、ビートルズを再生したことを示すテキスト「Played Beatles」をホームサーバー3に送信する(図3の(12))。ホームサーバー3のCPU31は、NW I/F34を介して、スマートフォン6から送信されるテキストを受信する。CPU31は、NW I/F34を介して、受信したテキストをクラウドサーバー4に送信し、クラウドサーバー4に音声合成を要求する(図3の(13))。
【0029】
クラウドサーバー4は、音声合成を行い、音声合成データをホームサーバー3に送信し、音声合成の結果を応答する(図3の(14))。ホームサーバー3のCPU31は、NW I/F34を介して、クラウドサーバー4から送信される音声合成データを受信する。次に、CPU31は、NW I/F34を介して、受信した音声合成データを端末装置2に送信する(図3の(15))。端末装置2のマイクロコンピュータ21は、ホームサーバー3が送信した音声合成データを受信する。マイクロコンピュータ21は、受信した音声合成データに基づいてスピーカー23から音声を出力させる(図3の(16))。
【0030】
以下、音声認識キーワードDBからキーワードを抽出する、ホームサーバー3のフィルタ処理を、図4に示すフローチャートに基づいて説明する。クラウドサーバー3は、音声認識を行い、音声認識の結果を応答する(S1)。次に、ホームサーバー3のCPU31は、クラウドサーバー4から受信した音声認識結果が、アプリケーション名(Application Name)、プロファイル(Profile)、アクション(Action)のいずれかであるかを判断する(S2)。CPU31は、クラウドサーバー4から受信した音声認識結果が、アプリケーション名(Application Name)、プロファイル(Profile)、アクション(Action)のいずれかであると判断した場合(S2:Yes)、制御コマンドの送信先にアクセサリー(Accessory)を設定する(S3)。
【0031】
CPU31は、クラウドサーバー4から受信した音声認識結果が、アプリケーション名(Application Name)、プロファイル(Profile)、アクション(Action)のいずれかでないと判断した場合(S2:No)、ターゲット(Target)であるか否かを判断する(S4)。CPU31は、クラウドサーバー4から受信した音声認識結果が、ターゲット(Target)でないと判断した場合(S4:No)、処理を終了する。
【0032】
CPU31は、クラウドサーバー4から受信した音声認識結果が、ターゲット(Target)であると判断した場合(S4:Yes)、発音情報であるか否かを判断する(S5)。CPU31は、クラウドサーバー4から受信した音声認識結果が、発音情報でないと判断した場合(S5:No)、処理を終了する。CPU31は、クラウドサーバー4から受信した音声認識結果が、発音情報であると判断した場合(S5:Yes)、受信した発音情報と、音声認識キーワードDBに登録されている発音情報と、に基づいて、タグ情報に変換する(S6)。
【0033】
以上説明したように、本実施形態では、ホームサーバー3のCPU31は、受信した発音情報と、記憶部33に記憶されている発音情報と、に基づいて、タグ情報を決定する。例えば、CPU31は、タグ情報として、アーティスト名を決定する。そして、CPU31は、決定したタグ情報とともに、制御コマンドをスマートフォン6に送信する。例えば、CPU31は、決定したアーティスト名とともに、制御コマンド「Play」をスマートフォン6に送信する。スマートフォン6は、アーティスト名と制御コマンド「Play」とにより、対応するアーティスト名の楽曲を再生することができる。本実施形態では、ホームサーバー3は、音声認識を行わず、クラウドサーバー4で音声認識を行うため、ホームサーバー3のプロセッサパワーが少なくてよい。このため、ホームサーバー3の単価を抑えることができる。
【0034】
また、クラウドサーバー4がタグ情報を扱わないため、ユーザー毎に異なるタグ情報の管理が不要になる。また、タグ情報を扱うことの許諾をユーザーから得ることが不要となる。
【0035】
また、本実施形態では、ホームサーバー3のCPU31は、タグ情報を発音情報に変換し、タグ情報と、変換した発音情報と、を対応付けて記憶部33に記憶する。これにより、タグ情報をクラウドサーバー4等に送信する必要がないため、外部とやり取りするデータ量が多くなることが防止される。
【0036】
以上、本発明の実施形態について説明したが、本発明を適用可能な形態は、上述の実施形態には限られるものではなく、以下に例示するように、本発明の趣旨を逸脱しない範囲で適宜変更を加えることが可能である。
【0037】
上述の実施形態においては、電子機器として、スマートフォンを例示した。これに限らず、携帯音楽再生装置、タブレットPC等であってもよい。
【産業上の利用可能性】
【0038】
本発明は、電子機器を制御するための電子機器制御システム、電子機器制御システムを構成するサーバー、及び、端末装置に好適に採用され得る。
【符号の説明】
【0039】
1 電子機器制御システム
2 端末装置
21 マイクロコンピュータ(第1制御部)
22 マイク
3 ホームサーバー(サーバー)
31 CPU(第2制御部)
33 記憶部
4 クラウドサーバー(外部サーバー)
6 スマートフォン(電子機器)
図1
図2
図3
図4
図5