IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エヴィクサー株式会社の特許一覧

特開2023-89689システム、情報処理装置、方法、およびプログラム
<>
  • 特開-システム、情報処理装置、方法、およびプログラム 図1
  • 特開-システム、情報処理装置、方法、およびプログラム 図2
  • 特開-システム、情報処理装置、方法、およびプログラム 図3
  • 特開-システム、情報処理装置、方法、およびプログラム 図4
  • 特開-システム、情報処理装置、方法、およびプログラム 図5
  • 特開-システム、情報処理装置、方法、およびプログラム 図6
  • 特開-システム、情報処理装置、方法、およびプログラム 図7A
  • 特開-システム、情報処理装置、方法、およびプログラム 図7B
  • 特開-システム、情報処理装置、方法、およびプログラム 図8
  • 特開-システム、情報処理装置、方法、およびプログラム 図9
  • 特開-システム、情報処理装置、方法、およびプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023089689
(43)【公開日】2023-06-28
(54)【発明の名称】システム、情報処理装置、方法、およびプログラム
(51)【国際特許分類】
   G10L 19/018 20130101AFI20230621BHJP
   G10L 13/00 20060101ALI20230621BHJP
   H04L 51/58 20220101ALI20230621BHJP
   H04B 11/00 20060101ALI20230621BHJP
【FI】
G10L19/018
G10L13/00 100C
G10L13/00 100K
H04L51/58
H04B11/00
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2021204346
(22)【出願日】2021-12-16
(71)【出願人】
【識別番号】511230233
【氏名又は名称】エヴィクサー株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】鈴木 久晴
(72)【発明者】
【氏名】長友 康彦
(72)【発明者】
【氏名】瀧川 淳
(57)【要約】      (修正有)
【課題】透かしデータを用いてラジオ放送技術の汎用性を高めるシステム、情報処理装置、方法及びプログラムを提供する。
【解決手段】制御システムは、第1音声データに透かしデータを埋め込むことにより第2音声データを生成する埋込部と、第2音声データをラジオ放送により送信する送信部と、第2音声データを受信する受信部と、受信された第2音声データから透かしデータを検出する検出部と、第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給する出力制御部と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1音声データに透かしデータを埋め込むことにより第2音声データを生成する埋込部と、
前記第2音声データをラジオ放送により送信する送信部と、
前記第2音声データを受信する受信部と、
受信された前記第2音声データから透かしデータを検出する検出部と、
前記第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給する出力制御部と、
を備えるシステム。
【請求項2】
前記透かしデータは、受信者の状況に関する情報を含む、
請求項1に記載のシステム。
【請求項3】
前記出力制御部は、前記透かしデータに音声制御に関する情報が含まれる場合には、前記音声制御に関する情報を前記出力装置に供給する、
請求項1または2に記載のシステム。
【請求項4】
前記出力制御部は、前記音声制御に関する情報に音声合成を指示する情報が含まれる場合、前記透かしデータに含まれるテキストデータを変換した音声データを合成し、合成した音声データを前記出力装置に供給する、
請求項3に記載のシステム。
【請求項5】
前記出力制御部は、前記音声制御に関する情報に音声再生を指示する情報が含まれる場合、再生の対象となる音声データを第1記憶部から取得し、前記取得した音声データを前記出力装置に供給する、
請求項3または4に記載のシステム。
【請求項6】
前記出力制御部は、前記透かしデータに表示制御に関する情報が含まれる場合には、前記表示制御に関する情報を前記出力装置に供給する、
請求項1から5のいずれか1項に記載のシステム。
【請求項7】
テキストデータと識別情報とを対応付けて記憶する第2記憶部をさらに有し、
前記出力制御部は、前記表示制御に関する情報に前記識別情報が含まれる場合には、前記第2記憶部を参照して前記識別情報に対応するテキストデータを取得し、前記取得したテキストデータを前記出力装置に供給する、
請求項6に記載のシステム。
【請求項8】
前記出力制御部は、前記第2記憶部に記憶されたテキストデータのうち、前記出力装置に出力済みのテキストデータを出力の対象から除外する、
請求項7に記載のシステム。
【請求項9】
前記出力制御部は、前記透かしデータに通知制御に関する情報が含まれる場合には、前記透かしデータに含まれる通知データを前記出力装置に供給する、
請求項1から8のいずれか1項に記載のシステム。
【請求項10】
前記出力制御部は、前記通知制御に関する情報に通知の対象となるテキストデータが含まれる場合、前記透かしデータに含まれるテキストデータを前記出力装置に供給する、
請求項9に記載のシステム。
【請求項11】
前記検出部は、前記受信部により前記第2音声データを受信した後、受信した第2音声データに埋め込まれた前記透かしデータの検出結果が所定の受信条件を変更するための条件を満たす場合、前記受信部による前記第2音声データの受信条件を変更する、
請求項1から10のいずれか1項に記載のシステム。
【請求項12】
前記送信部は、FM波を伝送媒体としたラジオ放送により、前記第2音声データを送信する、
請求項1から11のいずれか1項に記載のシステム。
【請求項13】
第1音声データに透かしデータを埋め込むことにより生成された第2音声データであって、ラジオ放送により送信された前記第2音声データから透かしデータを検出する検出部と、
前記第2音声データから検出された前記透かしデータに基づいて、出力装置に制御情報を供給する出力制御部と、
を備える情報処理装置。
【請求項14】
情報処理装置に、
第1音声データに透かしデータを埋め込むことにより生成された第2音声データであって、ラジオ放送により送信された第2音声データから透かしデータを検出するステップと、
前記第2音声データから検出された前記透かしデータに基づいて、出力装置に制御情報を供給するステップと、
を実行させる方法。
【請求項15】
情報処理装置に、
第1音声データに透かしデータを埋め込むことにより生成された第2音声データであって、ラジオ放送により送信された前記第2音声データから透かしデータを検出するステップと、
前記第2音声データから検出された前記透かしデータに基づいて、出力装置に制御情報を供給するステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、システム、情報処理装置、方法、およびプログラムに関する。
【背景技術】
【0002】
従来、所定の伝送媒体を介して音声データを送受信する技術として、IP網や移動体通信網を介した音声通話や、放送用電波を介したラジオ放送やテレビ放送などの様々な技術が知られている。
【0003】
例えば、特許文献1には、アナログラジオ放送用の信号処理回路に弱電界処理回路を備え、弱電界処理回路によりミュート等の選局チャネルの受信状態に応じた処理を行うラジオ受信機が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2011-109378号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ラジオ放送の技術は、音声データの送受信に関する他の技術と比較した場合、その構成の複雑さの度合は高くないが、設備設計の自由度は小さいと言える。このため、例えば透かしデータを音声データに重畳して、伝達する情報に他の情報を付加することといった応用技術しか提案がなされていない状況であるため、ラジオ放送技術の応用についてなお改善の余地があった。
【0006】
本発明は、このような事情に鑑みてなされたものであり、透かしデータを用いてラジオ放送技術の汎用性を高めることのできるシステム、情報処理装置、方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一側面に係るシステムは、第1音声データに透かしデータを埋め込むことにより第2音声データを生成する埋込部と、第2音声データをラジオ放送により送信する送信部と、第2音声データを受信する受信部と、受信された第2音声データから透かしデータを検出する検出部と、第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給する出力制御部と、を備える。
【0008】
本発明の一側面に係る情報処理装置は、第1音声データに透かしデータを埋め込むことにより生成された第2音声データであって、ラジオ放送により送信された第2音声データから透かしデータを検出する検出部と、第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給する出力制御部と、を備える。
【0009】
本発明の一側面に係る方法は、情報処理装置に、第1音声データに透かしデータを埋め込むことにより生成された第2音声データであって、ラジオ放送により送信された第2音声データから透かしデータを検出するステップと、第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給するステップと、を実行させる。
【0010】
本発明の一側面に係るプログラムは、情報処理装置に、第1音声データに透かしデータを埋め込むことにより生成された第2音声データであって、ラジオ放送により送信された第2音声データから透かしデータを検出するステップと、第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給するステップと、を実行させる。
【0011】
本発明の一側面に係る方法は、第1音声データに透かしデータを埋め込むことにより第2音声データを生成する埋込部と、第2音声データをラジオ放送により他の情報処理装置に送信する送信部と、を備える情報処理装置であって、他の情報処理装置は、第2音声データを受信する受信部と、受信された第2音声データから透かしデータを検出する検出部と、第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給する出力制御部と、を備える。
【0012】
本発明の一側面に係るプログラムは、情報処理装置に、第1音声データに透かしデータを埋め込むことにより第2音声データを生成するステップと、第2音声データをラジオ放送により他の情報処理装置に送信するステップと、を実行させるプログラムであって、他の情報処理装置は、第2音声データを受信する受信部と、受信された第2音声データから透かしデータを検出する検出部と、第2音声データから検出された透かしデータに基づいて、出力装置に制御情報を供給する出力制御部と、を備える。
【発明の効果】
【0013】
本発明によれば、透かしデータを用いてラジオ放送技術の汎用性を高めることができる。
【図面の簡単な説明】
【0014】
図1】本開示に係る制御システム1の概要を説明するための図である。
図2】実施形態に係る制御システム100の構成の一例を示す図である。
図3】実施形態に係る情報処理装置400のハードウェア構成の一例を示す図である。
図4】実施形態に係る送信側端末200の機能構成の一例を示す図である。
図5】実施形態に係る受信側端末300の機能構成の一例を示す図である。
図6】送信メッセージのデータ構造の一例を示す図である。
図7A】テキストデータベース321の設定内容の一例を示す図である。
図7B】BGMデータベース322の設定内容の一例を示す図である。
図8】実施形態に係る送信側端末200が実行する動作処理の一例を示す動作フロー図である。
図9】実施形態に係る受信側端末300が実行する動作処理の一例を示す動作フロー図である。
図10】実施形態に係る受信側端末300が実行する動作処理の一例を示す動作フロー図である。
【発明を実施するための形態】
【0015】
添付図面を参照して、本発明の好適な実施形態について説明する。(なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。)
【0016】
[概要]
図1は、本開示に係る制御システム1の概要を説明するための図である。制御システム1は、所定の伝送媒体Mを介して送受信される音声データに基づいて、出力装置35の出力動作を制御するためのシステムである。制御システム1は、例えば、互いに伝送媒体Mを介して接続された送信側システム2と、受信側システム3とを有する。送信側システム2は、例えば、1つ又は複数の情報処理装置によって構成される。受信側システム3は、例えば、1つ又は複数の情報処理装置によって構成される。
【0017】
伝送媒体Mは、ラジオ放送(FMラジオ、及びAMラジオ等)による情報の伝送に使用される媒体である。伝送媒体Mについて、ラジオ放送に使用される電波の周波数や、ラジオ放送に関する規格の有無・内容等は特に限定されない。
【0018】
送信側システム2は、例えば、伝送媒体Mを介して音声データを受信側システム3に送信する。受信側システム3は、例えば、送信側システム2から受信した音声データに基づいて、出力装置35の出力動作を制御する。
【0019】
送信側システム2は、例えば、埋込部21と、送信部22とを有する。
【0020】
埋込部21は、例えば、マイク等の音声入力装置に向かってユーザが発話することにより生成された第1音声データに透かしデータを埋め込むことにより、第2音声データを生成する。ここで、透かしデータは、例えば、音響透かしや音声透かしなどとも称され、文字、数字、及び符号等の情報を示す特徴量を有する音声のデータである。
【0021】
送信部22は、埋込部21が生成した第2音声データを、伝送媒体Mを介して受信側システム3に送信する。送信部22は、例えば、FM波を伝送媒体Mとしたラジオ放送により、埋込部21が生成した第2音声データを受信側システム3に送信する。
【0022】
受信側システム3は、例えば、受信部31と、検出部32と、出力制御部33と、記憶部34と、出力装置35とを有する。
【0023】
受信部31は、送信側システム2が送信した第2音声データを、伝送媒体Mを介して受信する。
【0024】
検出部32は、受信された第2音声データから透かしデータを検出する処理(検出処理)を実行する。検出処理は、例えば、第2音声データの音声波形を解析することにより、透かしデータが第2音声データに含まれているか否かを判定する。
【0025】
また、検出部32は、例えば、受信部31により第2音声データを受信した後、受信した第2音声データに埋め込まれた透かしデータの検出結果が所定の受信条件を変更するための条件を満たす場合、受信部31による第2音声データの受信条件を変更する。検出部32は、例えば、一定期間における第2音声データからの透かしデータの検出状況に基づいて、受信部31による第2音声データの受信条件を変更する。具体的には、検出部32は、例えば、一定期間における第2音声データからの透かしデータの検出回数が、所定の閾値未満である場合、受信部31による第2音声データの受信条件を変更してもよい。なお、所定の閾値(第1閾値)は、任意に設定可能としてもよい。或いは、検出部32は、例えば、一定期間において第2音声データからの透かしデータの検出を試みた回数に対する、透かしデータが正常に検出された回数の比率が、所定の閾値未満である場合、受信部31による第2音声データの受信条件を変更してもよい。なお、所定の閾値(第2閾値)は、任意に設定可能としてもよい。第2音声データの受信条件は、例えば、受信に用いる電波の周波数を含む。
【0026】
出力制御部33は、第2音声データから検出された透かしデータに基づいて、出力装置35の出力動作を制御する。出力装置35は、画像、音声、振動、光などの種々の出力態様による出力機能を有する装置であり、例えば、テレビ、スピーカ、スマートフォン、タブレット端末、警告灯を含む。
【0027】
透かしデータは、出力装置35の出力態様に応じた情報を含む。例えば、透かしデータは、音声制御に関する情報を含んでもよい。この場合、出力制御部33は、例えば、透かしデータに含まれる音声制御に関する情報を、音声の出力が可能な出力装置35に供給する。出力制御部33は、例えば、音声制御に関する情報に音声合成を指示する情報が含まれる場合、透かしデータに含まれるテキストデータを変換した音声データを合成し、合成した音声データを出力装置35に供給する。出力制御部33は、音声制御に関する情報に音声再生を指示する情報が含まれる場合、再生の対象となる音声データを記憶部34(第1記憶部)から取得し、取得した音声データを出力装置40に供給する。
【0028】
また、例えば、透かしデータは、表示制御に関する情報を含んでもよい。この場合、出力制御部33は、例えば、透かしデータに含まれる表示制御に関する情報を、表示による出力が可能な出力装置40に供給する。出力制御部33は、例えば、表示制御に関する情報に識別情報が含まれる場合には、記憶部34(第2記憶部)を参照して識別情報に対応するテキストデータを取得し、取得したテキストデータを出力装置40に供給する。出力制御部33は、例えば、記憶部34に記憶されたテキストデータのうち、出力装置40に出力済みのテキストデータを出力の対象から除外する。出力制御部33は、例えば、表示制御に関する情報に含まれる識別情報に基づいて、テキストデータの指定を受け付け、一度指定されたテキストデータを出力の対象から除外し、それ以降、当該テキストデータを指定する識別情報が入力されたとしても、当該指定を無効とする。
【0029】
また、例えば、透かしデータは、通知制御に関する情報を含んでもよい。この場合、出力制御部33は、例えば、透かしデータに通知制御に関する情報が含まれる場合には、透かしデータに含まれる通知制御に関する情報を出力装置40に供給する。出力制御部33は、例えば、通知制御に関する情報に通知の対象となるテキストデータが含まれる場合、透かしデータに含まれるテキストデータを出力装置40に供給する。具体的には、出力制御部33は、例えば、テキストデータの転送先となる出力装置40を指定し、指定された出力装置40にテキストデータを供給する。
【0030】
[実施形態]
(1)全体構成
図2は、実施形態に係る制御システム100の構成の一例を示す図である。図2に示すとおり、実施形態に係る制御システム100は、送信側端末200と、受信機301と、受信側端末302とを有する。送信側端末200は、例えば、所定の伝送媒体Mを介して、音声データを受信機301に送信可能である。送信側端末200は、上述した送信側システム2を構成し、第1音声データに透かしデータを埋め込んで得られる第2音声データを、伝送媒体Mを介して受信機301に送信する。また、受信機301及び受信側端末302は、上述した受信側システム3を構成し、送信側端末200から送信された第2音声データを受信機301が受信した上で、受信側端末302が、第2音声データから透かしデータを検出し、透かしデータに含まれる制御に関する情報に基づいて、出力装置35の出力動作を制御する。
【0031】
(2)ハードウェア構成
図3は、実施形態に係る情報処理装置400のハードウェア構成の一例を示す図である。実施形態に係る送信側端末200、受信機301、及び受信側端末302はそれぞれ、例えば、1つ又は複数の情報処理装置400によって構成され得る。情報処理装置400は、コンピュータを含み、具体的には、サーバ装置、パーソナルコンピュータ(PC)、PDA(PersonalDigitalAssistant)、スマートフォンやタブレット端末等の携帯情報端末、携帯電話機等が想定されるが、これらに限られるものではない。
【0032】
情報処理装置400は、プロセッサ401と、メモリ402と、ストレージ403と、入出力インターフェース(入出力I/F)404と、通信インターフェース(通信I/F)405とを有する。情報処理装置400のハードウェアの各構成要素は、例えば、バスBを介して相互に接続される。情報処理装置400は、プロセッサ401と、メモリ402と、ストレージ403と、入出力I/F404と、通信I/F405との協働により、本開示に記載される機能、及び/又は、方法を実現する。
【0033】
プロセッサ401は、ストレージ403に記憶されるプログラムに含まれるコード又は命令によって実現する機能、及び/又は、方法を実行する。プロセッサ401は、例えば、中央処理装置(CPU)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、マイクロプロセッサ(microprocessor)、プロセッサコア(processor core)、マルチプロセッサ(multiprocessor)、ASIC(Application―Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等を含み、集積回路(IC(Integrated Circuit)チップ、LSI(Large Scale Integration))等に形成された論理回路(ハードウェア)や専用回路によって実施形態に開示される各処理を実現してもよい。
【0034】
メモリ402は、ストレージ403からロードしたプログラムを一時的に記憶し、プロセッサ401に対して作業領域を提供する。メモリ402には、プロセッサ401がプログラムを実行している間に生成される各種データも一時的に格納される。メモリ402は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)などを有する。
【0035】
ストレージ403は、例えば、プログラムを記憶する。ストレージ403は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリなどを有する。
【0036】
入出力I/F404は、情報処理装置400に対する各種情報を入力する入力装置、及び、情報処理装置400で処理された処理結果を出力する出力装置を有する。入出力I/F404は、入力装置と出力装置が一体化していてもよいし、入力装置と出力装置とに分離していてもよい。特に、実施形態に係る受信側端末302を構成する情報処理装置400が備える入出力I/F404の出力装置は、図1に示す出力装置35に対応する。
【0037】
入力装置は、操作者からの入力を受け付けて、当該入力に係る情報をプロセッサ401に供給する。入力装置は、例えば、タッチパネル、タッチディスプレイ、キーボード等のハードウェアキーや、マウス等のポインティングデバイス等の操作入力装置、カメラ等の画像入力装置、及びマイク等の音声入力装置を含んでもよい。
【0038】
出力装置は、プロセッサ401で処理された処理結果を出力する。出力装置は、例えば、プロセッサ401で処理された処理結果としての表示データ(画面情報)にしたがって画像(動画を含む)を表示することができる表示装置を含んでもよい。表示装置は、例えば、タッチパネル、タッチディスプレイ、モニタ(例えば、液晶ディスプレイ、OELD(Organic Electroluminescence Display)など)、ヘッドマウントディスプレイ(HMD:HeadMountedDisplay)、プロジェクションマッピング、ホログラム等を含んでもよい。また、出力装置は、例えば、プロセッサ401で処理された処理結果としての音声データにしたがって音声を出力することができる音声出力装置を含んでもよい。音声出力装置は、例えば、スピーカ等を含んでもよい。
【0039】
通信I/F405は、伝送媒体Mを介して各種データの送受信を行う。当該通信は、有線、無線(近距離無線通信を含む)のいずれで実行されてもよく、互いの通信が実行できれば、どのような通信プロトコルを用いてもよい。通信I/F405は、伝送媒体Mを介して、他の情報処理装置や機器との通信を実行する機能を有する。通信I/F405は、各種データをプロセッサ401からの指示に従って、他の情報処理装置に送信する。また、通信I/F405は、他の情報処理装置や機器から送信された各種データを受信し、プロセッサ401に供給する。特に、送信側端末200を構成する情報処理装置400が有する通信I/F405は、例えば、ラジオ放送による放送波を伝送媒体Mに向けて送信可能に構成されたアンテナを含む。また、受信機301を構成する情報処理装置400が有する通信I/F405は、例えば、ラジオ放送による放送波を伝送媒体Mから受信可能に構成されたアンテナを含む。
【0040】
実施形態のプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。プログラムは、例えば、ソフトウェアプログラムやコンピュータプログラムを含む。記憶媒体は適切な場合、1つ又は複数の半導体ベースの、又は他の集積回路(IC)(例えば、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向けIC(ASIC)など)、ハード・ディスク・ドライブ(HDD)、ハイブリッド・ハード・ドライブ(HHD)、光ディスク、光ディスク・ドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピィ(登録商標)・ディスケット、フロッピィ(登録商標)・ディスク・ドライブ(FDD)、磁気テープ、固体ドライブ(SSD)、RAMドライブ、セキュア・デジタル・カードもしくはドライブ、任意の他の適切な記憶媒体、又はこれらの2つ以上の適切な組合せを含むことができる。記憶媒体は、適切な場合、揮発性、不揮発性、又は揮発性と不揮発性の組合せでよい。
【0041】
本開示のプログラムは、当該プログラムを伝送可能な任意のネットワークを介して、情報処理装置400に提供されてもよい。また、実施形態は、プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。なお、本開示のプログラムは、例えば、ActionScript、JavaScript(登録商標)などのスクリプト言語、Objective-C、Java(登録商標)などのオブジェクト指向プログラミング言語、HTML5などのマークアップ言語などを用いて実装されてもよい。
【0042】
情報処理装置400における処理の少なくとも一部は、1つ又は複数のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。情報処理装置400における処理の少なくとも一部を、他の情報処理装置により行う構成としてもよい。この場合、プロセッサ401により実現される各機能部の処理のうち少なくとも一部の処理を、他の情報処理装置で行う構成としてもよい。
【0043】
(3)機能構成
(3-1)送信側端末200
図4は、実施形態に係る送信側端末200の機能構成の一例を示す図である。図4に示すとおり、送信側端末200は、例えば、制御部210と、記憶部34とを有する。図4に開示の各機能部は、情報処理装置400が有するプロセッサ401と、メモリ402と、ストレージ403と、入出力I/F404と、通信I/F405との協働により実現される。具体的には、制御部210は、例えば、入出力I/F404、通信I/F405、及びプロセッサ401等により実現され、記憶部220は、例えば、メモリ402、及び/又はストレージ403等により実現される。
【0044】
制御部210は、例えば、音声取得部211と、埋込部212と、送信部213と、を有する。
【0045】
音声取得部211は、第1音声データを取得する。音声取得部211は、例えば、入出力I/F404が有するマイク等の音声入力装置を制御して、当該音声入力装置に向かって発話するユーザの音声に基づいて音声データを生成することにより、当該音声データを第1音声データとして取得する。音声取得部211は、例えば、ラジオ局のスタジオ等に備え付けられたマイクを通じて入力された音声とBGMなどの他の音源の音声とに基づいて第1音声データを生成することにより、当該音声データを第1音声データとして取得する。なお、音声取得部211は、例えば、予め記憶部220等に格納された音声データを、第1音声データとして取得してもよい。
【0046】
埋込部212は、音声取得部211が取得した第1音声データに透かしデータを埋め込むことにより、第2音声データを生成する。埋込部212は、例えば、記憶部220に記憶された透かしデータ221を参照して、当該埋込を実行してもよい。埋込部212は、例えば、公知の手法を用いて第1音声データの所定の埋込位置に透かしデータを埋め込む(例えば、周期的に音声波形を加工する、ミキサーにより所定の音声波形を重畳する等)ことにより、第2音声データを生成する。また、埋込部212は、例えば、入出力I/F404が有する入力装置に対する入力操作を受け付け、当該入力装置が示すテキストデータ等を透かしデータとして生成し、これを第1音声データに埋め込むことにより、第2音声データを生成してもよい。
【0047】
埋込部212は、例えば、第1音声データに透かしデータ221を埋め込むための所定の埋込条件が満たされるか否かを判定してもよい。そして、埋込部212は、例えば、埋込条件が満たされると判定された場合に、当該透かしデータ221を第1音声データの所定の埋込位置に埋め込んでもよい。
【0048】
埋込条件は、例えば、任意に設定可能な、周期的又は非周期的な所定のタイミングが到来したことを含んでもよい。また、埋込条件は、例えば、所定の埋込指示が取得されたことを含んでもよい。埋込指示は、送信側端末200の入出力I/F404が有する操作入力装置に対するユーザの入力操作に応じて生成されたものであってもよいし、送信側端末200が他の情報処理装置から取得したものであってもよい。
【0049】
送信部213は、例えば、受信機301等の他の情報処理装置に、所定の伝送媒体Mを介して各種の情報を送信する。送信部213は、例えば、受信機301に所定の伝送媒体Mを介して第2音声データを送信する。すなわち、送信部213は、例えば、埋込部212により透かしデータが埋め込まれた第2音声データを、伝送媒体Mによって伝送可能となるように変調し、得られた変調波を通信I/F405が有するアンテナを介して大気中に放射する。
【0050】
送信部213は、例えば、第2音声データを送信するための所定の送信条件が満たされるか否かを判定してもよい。そして、送信部22は、例えば、送信条件が満たされると判定された場合に、埋込部21により生成された第2音声データを所定の伝送媒体Mを介して受信側端末300に送信してもよい。送信条件は、例えば、任意に設定可能な、周期的又は非周期的な所定のタイミングが到来したことを含んでもよい。また、送信条件は、例えば、所定の送信指示が取得されたことを含んでもよい。
【0051】
(3-2)受信側端末302
図5は、実施形態に係る受信側端末302の機能構成の一例を示す図である。受信側端末302は、例えば、受信機301に有線又は無線により接続されており、受信機301が受信した音声データが供給され得る。図5に示すとおり、受信側端末302は、例えば、制御部310と、記憶部320と、出力装置330とを有する。制御部310は、例えば入出力I/F404、通信I/F405、及びプロセッサ401等により実現され、記憶部320は、例えばメモリ402、及び/又はストレージ403等により実現される。また、出力装置330は、例えば、入出力I/F404が有する出力装置により実現され、図1に示した出力装置35に対応する。
【0052】
受信機301は、受信部31の一例であって、例えば、送信側端末200等の他の情報処理装置から所定の伝送媒体Mを介して各種の情報を受信する。受信機301は、例えば、送信側端末200が送信した第2音声データを受信する。受信機301は、例えば、送信側端末200から送信された第2音声データを含む電波をアンテナにより受信し、受信した電波を復調することにより第2音声データを取得し、これを受信側端末302に供給する。なお、受信側端末302が受信部31としての機能を有してもよく、受信側端末302が、送信側端末200が送信した第2音声データを受信してもよい。
【0053】
受信側端末302の制御部310は、例えば、検出部311と、出力制御部312とを備える。
【0054】
検出部311は、例えば、受信機301から供給された第2音声データから透かしデータ221を検出する。透かしデータ221は、例えば、図5に示すようなデータ構造を有する。
【0055】
出力制御部312は、例えば、出力装置330による出力動作を制御する。出力制御部312は、例えば、出力装置330が有する音声出力装置を制御して、第2音声データに基づく音声等を出力させてもよい。また、出力制御部312は、例えば、出力装置330が有する表示装置を制御して、所定の表示データに基づいて画像(動画を含む)を表示させてもよい。
【0056】
ここで、図6を参照して、透かしデータ221のデータ構造と、出力制御部312による透かしデータ221に基づいた出力装置330の制御について更に説明する。図6は、透かしデータ221のデータ構造の一例を示す図である。同図に示す例では、透かしデータ221は、メタデータD1と、制御データD2と、テキストデータD3とを含む。透かしデータ221のデータ構造は、例えば、JSON(JavaScript Object Notation)やその他の任意の形式によって記述されてもよい。なお、透かしデータ221のデータ構造は、図6に示すものに限られなくてもよい。
【0057】
メタデータD1は、出力制御の内容に付随する付加的なデータである。メタデータD1は、例えば、エリアコード、データID、及びデータグループID等を含んでもよい。エリアコードは、例えば、透かしデータ221に基づく出力装置40の制御対象となるエリアを示す情報である。出力制御部312は、例えば、当該エリアコードと、予め受信側端末302に対して設定されたエリアコード(例えば、受信側端末302の記憶部320等に記憶されてもよい)とを比較した上で、これらが一致した場合に、透かしデータ221に基づく出力制御を実行してもよい。これにより、例えば、受信側端末302が置かれたエリアの環境(例えば、騒音が多い環境等)に応じた出力制御を、受信側端末302に実行させることが可能となる。データIDは、例えば、透かしデータ221を特定するための識別情報である。データグループIDは、1つまたは複数の透かしデータが分類されたグループを特定するための識別情報である。透かしデータ221のグループは、例えば、防災に関する情報が分類されたグループと、チラシに関する情報が分類されたグループと、地域に関する情報が分類されたグループとを含んでもよい。これら透かしデータ221のグループごとに、透かしデータ221に含まれる音声制御に関するデータ、画面制御に関するデータ、通知制御に関するデータが有効であるか否かが設定されてもよい。
【0058】
制御データD2は、出力装置40の出力動作の制御に関するデータであり、例えば、音声制御に関するデータ、及び表示制御に関するデータ等を含む。テキストデータD3は、文字、図形、記号等から成るテキストを示すデータである。
【0059】
<音声制御>
出力制御部312は、例えば、制御データD2が含む音声制御に関するデータに基づいて、出力装置330が有する音声出力装置による音声出力を制御することができる。
【0060】
制御データD2が含む音声制御に関するデータは、例えば、所定のテキストデータに基づいて合成音声を出力する処理であるTTS(Text-to-Speech Synthesis)の制御に関するデータを含んでもよい。制御データD2は、TTSの制御に関する任意の情報を含んでもよく、例えば、透かしデータ221がTTS制御の対象であるか否かを示す情報、及び、TTSを強制的に実行するか否かを示す情報等を含んでもよい。TTS制御として例えば、出力制御部312は、透かしデータ221に含まれるテキストデータD3を示す合成音声を生成し、これを出力装置330が有する音声出力装置に出力させてもよい。或いは、TTS制御として例えば、出力制御部312は、透かしデータ221に含まれる制御データD2が含むテキストIDを取得した上で、後述するテキストデータベース321において当該テキストIDに対応付けられたテキストデータを示す合成音声を生成し、これを出力装置330が有する音声出力装置に出力させてもよい。
【0061】
制御データD2が含む音声制御に関するデータは、例えば、所定のBGM(Background Music)を再生する処理の制御に関するデータを含んでもよい。制御データD2は、BGMの再生の制御に関する任意の情報を含んでもよく、例えば、透かしデータ221がBGMを再生する処理の対象であることを示す情報、及び、再生するBGMを識別するための識別情報(BGM ID)等を含んでもよい。BGMの再生の制御として例えば、出力制御部312は、透かしデータ221に含まれる制御データD2が含むBGM IDを取得した上で、後述するBGMデータベース322において当該BGM IDに対応付けられた楽曲の再生データを取得し、これを出力装置330が有する音声出力装置に出力させてもよい。楽曲の再生データは、受信側端末302の記憶部320に記憶されたものであってもよいし、或いは、インターネット等の所定のネットワークを介して受信側端末302が他の情報処理装置から取得したものであってもよい。
【0062】
<表示制御>
出力制御部312は、例えば、制御データD2が含む表示制御に関するデータに基づいて、出力装置330が有する表示装置による表示出力を制御することができる。
【0063】
制御データD2が含む表示制御に関するデータは、例えば、表示装置に所定のテキストを表示させる制御に関するデータを含んでもよい。制御データD2は、テキストの表示制御に関する任意の情報を含んでもよく、例えば、透かしデータ221がテキストの表示制御の対象であるか否かを示す情報等を含んでもよい。テキストの表示制御として例えば、出力制御部312は、透かしデータ221に含まれるテキストデータD3に基づいて、当該テキストデータD3を示すテキストを、出力装置330が有する表示装置に表示させてもよい。或いは、テキストの表示制御として例えば、出力制御部312は、透かしデータ221に含まれる制御データD2が含むテキストIDを取得した上で、後述するテキストデータベース321において当該テキストIDに対応付けられたテキストデータを取得し、これを示すテキストを、出力装置330が有する表示装置に表示させてもよい。
【0064】
制御データD2が含む表示制御に関するデータは、例えば、表示装置の表示態様の制御に関するデータを含んでもよい。制御データD2は、表示装置の表示態様に関する任意の情報を含んでもよく、例えば、透かしデータ221が表示装置の表示態様の制御の対象であるかを示す情報や、表示装置の表示態様の内容を示す情報を含んでもよい。表示態様の内容としては、例えば、表示のオン/オフ、点滅、画質(明度や色度等)の調整等を含んでもよい。
【0065】
記憶部320は、例えば、テキストデータベース321と、BGMデータベース322とを記憶する。
【0066】
図7Aは、テキストデータベース321のデータ構造の一例を示す図である。図7Aに示すように、テキストデータベース321は、出力装置40の出力対象(例えば、音声出力装置による音声出力や、表示装置による表示出力)となるテキストデータを格納しており、テキストIDとテキスト内容とが対応付けられている。テキストIDは、テキスト内容を特定するための識別情報である。テキスト内容は、出力装置40により出力されるテキストの内容を示している。同図に示す例では、テキストデータベース321は、災害時の警告メッセージ等をテキスト内容として格納している。
【0067】
図7Bは、BGMデータベース322のデータ構造の一例を示す図である。図7Bに示すように、BGMデータベース322は、出力装置40の出力対象(例えば、音声出力装置による音声出力)となるBGMを示すデータを格納しており、BGM IDと楽曲(を示す情報)とが対応付けられている。BGM IDは、楽曲を特定するための識別情報である。同図に示す例では、BGMデータベース322は、災害時に再生するための楽曲を示す情報を格納している。なお、楽曲の再生データは、受信側端末302の記憶部320に記憶されたものであってもよいし、或いは、インターネット等の所定のネットワークを介して受信側端末302が他の情報処理装置から取得したものであってもよい。
【0068】
(4)動作処理
(4-1)送信側端末200の動作処理
図8は、実施形態に係る送信側端末200が実行する動作処理の一例を示す動作フロー図である。
【0069】
(S101)
まず、送信側端末200の音声取得部211は、第1音声データの取得を開始する。これにより、音声取得部211は、例えば、入出力I/F404が有するマイク等の音声入力装置を制御して、当該音声入力装置に向かって発話するユーザの音声に基づいて第1音声データを順次に生成する。
【0070】
(S102)
次に、送信側端末200の埋込部212は、第1音声データに透かしデータ221を埋め込むための所定の埋込条件が満たされるか否かを判定する。ここで、所定の埋込条件は、例えば、周期的又は非周期的な所定のタイミングが到来したことを含んでもよい。また、所定の埋込条件は、例えば、所定の埋込指示が取得されたことを含んでもよい。所定の埋込指示は、送信側端末200の入出力I/F404が有する操作入力装置に対するユーザ(発話者を含む)の入力操作に応じて生成されたものであってもよいし、他の情報処理装置から取得されたものであってもよい。当該ステップS102は、例えば、所定の周期で繰り返される(S102;No)。
【0071】
(S103)
次に、送信側端末200の埋込部212は、所定の埋込条件が満たされると判定された場合(S102;Yes)、第1音声データのうち、当該所定の埋込条件が満たされると判定されたタイミングに対応する位置に透かしデータ221を埋め込むことにより第2音声データを生成する。
【0072】
(S104)
次に、送信側端末200の送信部213は、所定の送信条件が満たされるか否かを判定する。ここで、所定の送信条件は、例えば、周期的又は非周期的な所定のタイミングが到来したことを含んでもよい。所定の送信条件が満たされないと判定された場合(S104;No)、処理はステップS102に戻る。
【0073】
(S105)
一方、送信条件が満たされると判定された場合(S104;Yes)、送信側端末200の送信部213は、ステップS103で生成された第2音声データを所定の伝送媒体Mを介して受信側端末300に送信する。送信部213は、例えば、埋込部212により透かしデータが埋め込まれた第2音声データを、伝送媒体Mによって伝送可能となるように変調し、得られた変調波を通信I/F405が有するアンテナを介して大気中に放射する。その後、送信側端末200の処理は、ステップS102に戻り、以降は、所定の終了条件が満たされるまで上述したステップS102~S105が繰り返される。
【0074】
(4-2)受信側端末302の動作処理
図9は、実施形態に係る受信側端末302が実行する動作処理の一例を示す動作フロー図である。具体的には、図9は、実施形態に係る受信側端末302による音声データの取得及び受信条件の変更等の処理の一例を示す動作フロー図である。
【0075】
(S201)
まず、受信機301が、送信側端末200から所定の伝送媒体Mを介して送信された第2音声データを受信し、これを受信側端末302に供給すると、受信側端末302は、受信機301から当該第2音声データを取得する。
【0076】
(S202)
次に、受信側端末302の検出部311は、第2音声データからの透かしデータ221の検出処理を実行する。検出部311は、例えば、第2音声データの音声波形を解析することにより、透かしデータ221が第2音声データに含まれているか否かを判定する。透かしデータ221が検出された場合、検出部311は、検出された透かしデータを記憶部320に格納する。
【0077】
(S203)
次に、受信側端末302の検出部311は、第2音声データからの透かしデータ221の検出処理の結果(検出結果)が、受信条件を変更(「オートチューニング」とも称され得る)するための所定の条件を満たすか否かを判定する。所定の条件は、例えば、一定期間における第2音声データからの透かしデータ221の検出回数が、所定の閾値未満であることを含んでもよい。或いは、所定の条件は、例えば、一定期間において第2音声データからの透かしデータ221の検出を試みた回数に対する、透かしデータが正常に検出された回数の比率が、所定の閾値未満であることを含んでもよい。
【0078】
(S204)
第2音声データからの透かしデータ221の検出結果が受信条件を変更するための所定の条件を満たす場合(S202;YES)、受信側端末302の検出部311は、受信機301による第2音声データの受信周波数を変更し、その後、処理はステップS201に戻る。
【0079】
一方、第2音声データからの透かしデータ221の検出結果が受信条件を変更するための所定の条件を満たさない場合(S202;NO)、処理はステップS201に戻る。以降は、所定の終了条件が満たされるまで、上記処理が繰り返され、適宜受信条件が変更されながら、第2音声データの取得及び透かしデータ221の検出等が実行される。
【0080】
図10は、実施形態に係る受信側端末302が実行する動作処理の一例を示す動作フロー図である。具体的には、図10は、実施形態に係る受信側端末302が実行する、透かしデータに基づいた出力装置の制御処理の一例を示す動作フロー図である。
【0081】
(S301)
まず、受信側端末302の出力制御部312は、例えば上述したステップS202において第2音声データから検出され記憶部320に格納された透かしデータ221を取得する。出力制御部312は、例えば、第2音声データから検出された順に応じた順(第2音声データの時間軸に沿った順)で、透かしデータ221を取得してもよい。透かしデータ221の取得単位は、任意に設定されてもよく、1つ又は複数であってもよい。
【0082】
(S302)
次に、受信側端末302の出力制御部312は、取得された透かしデータ221が規定する出力制御の内容を判定する。例えば、出力制御部312は、透かしデータ221に含まれる制御データD2に基づいて、当該透かしデータ221が規定する出力制御の内容(音声制御、及び表示制御等)を判定してもよい。また、出力制御部312は、例えば、透かしデータ221に含まれる制御データD2にテキストIDが含まれる場合、テキストデータベース321を参照して、音声制御又は表示制御におけるテキストの内容を判定してもよい。また、出力制御部312は、例えば、透かしデータ221に含まれる制御データD2にBGM IDが含まれる場合、BGMデータベース322を参照して、音声制御における楽曲の内容を判定してもよい。また、出力制御部312は、透かしデータ221に含まれるテキストデータD3に基づいて、音声制御又は表示制御におけるテキストの内容を判定してもよい。
【0083】
(S303)
次に、受信側端末302の出力制御部312は、取得された透かしデータ221に基づいて、当該透かしデータ221が規定する出力制御の内容に応じて、出力装置330による出力動作を制御する。
【0084】
TTS制御として例えば、出力制御部312は、透かしデータ221に含まれるテキストデータD3を示す合成音声を生成し、これを出力装置330が有する音声出力装置に出力させてもよい。或いは、TTS制御として例えば、出力制御部312は、透かしデータ221に含まれる制御データD2が含むテキストIDを取得した上で、後述するテキストデータベース321において当該テキストIDに対応付けられたテキストデータを示す合成音声を生成し、これを出力装置330が有する音声出力装置に出力させてもよい。
【0085】
BGMの再生の制御として例えば、出力制御部312は、透かしデータ221に含まれる制御データD2が含むBGM IDを取得した上で、後述するBGMデータベース322において当該BGM IDに対応付けられた楽曲の再生データを取得し、これを出力装置330が有する音声出力装置に出力させてもよい。楽曲の再生データは、受信側端末302の記憶部320に記憶されたものであってもよいし、或いは、インターネット等の所定のネットワークを介して受信側端末302が他の情報処理装置から取得したものであってもよい。
【0086】
テキストの表示制御として例えば、出力制御部312は、透かしデータ221に含まれるテキストデータD3に基づいて、当該テキストデータD3を示すテキストを、出力装置330が有する表示装置に表示させてもよい。或いは、テキストの表示制御として例えば、出力制御部312は、透かしデータ221に含まれる制御データD2が含むテキストIDを取得した上で、後述するテキストデータベース321において当該テキストIDに対応付けられたテキストデータを取得し、これを示すテキストを、出力装置330が有する表示装置に表示させてもよい。また、出力制御部312は、例えば、出力装置330が有する表示装置の表示のオン/オフ、点滅の態様、画質(明度や色度等)の調整等を制御してもよい。
【0087】
[変形例]
上述した実施形態に係る受信側端末302は、第2音声データに含まれる透かしデータ221に基づいて、受信側端末302が備える出力装置330の出力動作を制御するものとした。しかしながら、受信側端末302は、受信側端末302が備える出力装置330に限らず、任意の外部デバイスについて、出力制御(音声制御、及び表示制御等)を実行してもよい。例えば、受信側端末302は、透かしデータ221が含むメタデータD1、制御データD2、及びテキストデータD3等に基づいて制御信号を生成し、当該外部デバイスに供給することにより、外部デバイスの出力動作を制御してもよい。
【0088】
例えば、外部デバイスは、警告用のサイレンランプ等の点灯装置であってもよい。この場合、受信側端末302の出力制御部312は、第2音声データから検出された透かしデータ221に基づいて点灯装置の点灯の態様(点灯のオン/オフ、点灯の態様等)を制御するための制御信号を生成し、当該点灯装置に供給することにより、点灯装置の点灯を制御してもよい。或いは、外部デバイスは、他の情報処理装置(例えば上述した、スマートフォン、タブレット端末、PC等)であってもよい。この場合、受信側端末302の出力制御部312は、第2音声データから検出された透かしデータ221に基づいて、当該他の情報処理装置の出力制御(音声制御、及び表示制御等)のための制御信号を生成し、当該他の情報処理装置に供給することにより、当該他の情報処理装置の出力動作を制御してもよい。
【0089】
本発明は、上述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記実施形態及び変形例はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、上述した各ステップは処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。また、各ステップ間に他のステップを追加してもよい。また、1ステップとして記載されているステップを、複数ステップに分けて実行してもよいし、複数ステップに分けて記載されているものを、1ステップとして把握することもできる。
【符号の説明】
【0090】
1…制御システム、2…送信側システム、21…埋込部、22…送信部、3…受信側システム、31…受信部、32…検出部、33…出力制御部、34…記憶部、35…出力装置、100…制御システム、200…送信側端末、210…制御部、211…音声取得部、212…埋込部、213…送信部、220…記憶部、221…透かしデータ、301…受信機、302…受信側端末、310…制御部、311…検出部、312…出力制御部、320…記憶部、321…テキストデータベース、322…BGMデータベース、330…出力装置、400…情報処理装置、401…プロセッサ、402…メモリ、403…ストレージ、404…入出力I/F、405…通信I/F。
図1
図2
図3
図4
図5
図6
図7A
図7B
図8
図9
図10