IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 合同会社音楽呼吸総研の特許一覧

特許7538581音声生成装置、音声生成システム及びコンピュータプログラム
<>
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図1
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図2
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図3
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図4
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図5
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図6
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図7
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図8
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図9
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図10
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図11
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図12
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図13
  • 特許-音声生成装置、音声生成システム及びコンピュータプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-08-14
(45)【発行日】2024-08-22
(54)【発明の名称】音声生成装置、音声生成システム及びコンピュータプログラム
(51)【国際特許分類】
   G10L 13/033 20130101AFI20240815BHJP
   G10L 13/04 20130101ALI20240815BHJP
【FI】
G10L13/033 102B
G10L13/04 Z
【請求項の数】 6
(21)【出願番号】P 2024534764
(86)(22)【出願日】2024-03-21
(86)【国際出願番号】 JP2024011134
【審査請求日】2024-06-11
(31)【優先権主張番号】P 2023047639
(32)【優先日】2023-03-24
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】518122560
【氏名又は名称】合同会社音楽呼吸総研
(74)【代理人】
【識別番号】100108947
【弁理士】
【氏名又は名称】涌井 謙一
(74)【代理人】
【識別番号】100117086
【弁理士】
【氏名又は名称】山本 典弘
(74)【代理人】
【識別番号】100124383
【弁理士】
【氏名又は名称】鈴木 一永
(74)【代理人】
【識別番号】100173392
【弁理士】
【氏名又は名称】工藤 貴宏
(74)【代理人】
【識別番号】100189290
【弁理士】
【氏名又は名称】三井 直人
(72)【発明者】
【氏名】宮浦 清
【審査官】山下 剛史
(56)【参考文献】
【文献】特表2019-507389(JP,A)
【文献】特表2006-513448(JP,A)
【文献】特開2011-133882(JP,A)
【文献】特開2014-224976(JP,A)
【文献】国際公開第2018/021519(WO,A1)
【文献】米国特許出願公開第2012/0312145(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10
G10H 1/00
G10G 1/00
(57)【特許請求の範囲】
【請求項1】
コンテンツデータが入力されると、対応する音声データを生成する音声生成装置であって、
以下の構成を備えることを特徴とする音声生成装置。
(1)以下の構成で構築されるパケットデータが記憶手段に記憶されている。
(a)(n+2)個(n≧1)の音情報記憶スロットからなる(n+2)音1拍を一単位とする音情報記憶領域
(b)1音を構成する音名コードに対応する第一の音属性コードが、1番目の前記音情報記憶スロットに設定される。
(c)(n+2)個未満の複数音を構成する音名コードに対応する第二の音属性コードが、以下の条件で前記音情報記憶スロットに設定される。
(c1)前記1番目の音情報記憶スロットに設定される。
(c2)n=1の場合、2番目又は3番目の音情報記憶スロットに設定される。
(c3)n≧2の場合、偶数番目、奇数番目及び(n+2)番目の音情報記憶スロットの中から選択される一つの前記音情報記憶スロットに設定される。
(c4)n≧2の場合、さらに、偶数番目、奇数番目及び(n+2)番目の前記音情報記憶スロットの中から選択される複数の前記音情報記憶スロットの組み合わせに設定される。
(d)(n+2)個の音を構成する音名コードに対応する第三の音属性コードが、すべての前記音情報記憶スロットに設定される。
(2)以下の手順に従って、入力された前記コンテンツデータに対応する(n+2)音1拍を一単位とする音声データを生成する音声生成手段
(a)入力された前記コンテンツデータを前記第一の音属性コード、前記第二の音属性コード及び前記第三の音属性コードの少なくとも一方と関連付けて前記パケットデータを生成する処理を行う。
(b)前記パケットデータに対応する前記音名コードで構成される前記音声データを生成する処理を行う。
【請求項2】
以下の構成をさらに備える請求項1記載の音声生成装置。
(1)(e)前記パケットデータには、前記第一の音属性コード、前記第二の音属性コード及び前記第三の音属性コードの前記音情報記憶スロットへの設定パターンを表すパターンコードが付与される。
(f)前記パターンコードと、前記第一の音属性コード、前記第二の音属性コード又は前記第三の音属性コードの組み合わせをフレーズコードとし、複数の前記フレーズコードがサウンドIDとして設定される。
【請求項3】
以下の構成をさらに備える請求項1記載の音声生成装置。
(1)(e)複数の前記パケットデータが階層化され、一のパケットデータに係る前記音情報記憶領域に、他のパケットデータに係る前記音情報記憶領域が設定されている。
(2)(c)入力された前記コンテンツデータを、何れかの階層の前記パケットデータに設定されている前記第一の音属性コード、前記第二の音属性コード及び前記第三の音属性コードの少なくとも一方と関連付ける処理を行う。
【請求項4】
以下の構成をさらに備えることを特徴とする請求項1から請求項3の何れか一項に記載の音声生成装置。
(3)前記生成された音声データを出力する音声データ出力手段
【請求項5】
コンテンツデータが入力されると、対応する音声データを生成する音声生成装置と、前記音声データを前記音声生成装置から受信する受信端末と、を備える音声生成システムであって、
以下の構成を備えることを特徴とする音声生成システム。
(1)前記音声生成装置は、以下の構成で構築されるパケットデータを記憶している記憶手段を備えている。
(a)(n+2)個(n≧1)の音情報記憶スロットからなる(n+2)音1拍を一単位とする音情報記憶領域
(b)1音を構成する音名コードに対応する第一の音属性コードが、1番目の前記音情報記憶スロットに設定される。
(c)(n+2)個未満の複数音を構成する音名コードに対応する第二の音属性コードが、以下の条件で前記音情報記憶スロットに設定される。
(c1)前記1番目の音情報記憶スロットに設定される。
(c2)n=1の場合、2番目又は3番目の音情報記憶スロットに設定される。
(c3)n≧2の場合、偶数番目、奇数番目及び(n+2)番目の音情報記憶スロットの中から選択される一つの前記音情報記憶スロットに設定される。
(c4)n≧2の場合、さらに、偶数番目、奇数番目及び(n+2)番目の前記音情報記憶スロットの中から選択される複数の前記音情報記憶スロットの組み合わせに設定される。
(d)(n+2)個の音を構成する音名コードに対応する第三の音属性コードが、すべての前記音情報記憶スロットに設定される。
(2)前記音声生成装置は、以下の手順に従って、入力された前記コンテンツデータに対応する(n+2)音1拍を一単位とする音声データを生成する音声生成手段を備えている。
(a)入力された前記コンテンツデータを前記第一の音属性コード、前記第二の音属性コード及び前記第三の音属性コードの少なくとも一方と関連付けて前記パケットデータを生成する処理を行う。
(b)前記パケットデータに対応する前記音名コードで構成される前記音声データを生成する処理を行う。
(3)前記音声生成装置は、前記生成された音声データを出力する音声データ出力手段を備える。
(4)前記受信端末は、前記生成された音声データを、前記コンテンツデータに変換するデータ変換手段を備える。
【請求項6】
請求項5記載の音声生成システムとしてコンピュータを機能させるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音声生成装置、音声生成システム及びコンピュータプログラムに関する。
【背景技術】
【0002】
今日の情報通信社会において、入力した文字情報を所定の言語体系で音声出力する音声変換方法や、特定の情報に対して、当該特定の情報であると識別することができる固有の表現生成方法等が種々提案されている。
【0003】
特許文献1には、発明者による音声生成装置、音声生成方法及びプログラムが提案されている。特許文献1によれば、日本語による文字データから、当該日本語の言語的意味を持った音楽フレーズを生成することができる。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2014-224976号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1で提案されている発明では、入力された日本語1文字に対して2音の音符コードを抽出して音声データを生成するため、当該音声データに係る音楽フレーズは全体としてリズムの変化がない平坦なものとなっている。そこで、所定のリズムを有する音楽フレーズを生成することが課題となっていた。
【0006】
この発明は、入力された文字データや記号データ及びこれらの組み合わせに対してリズムの変化を有する音声フレーズを生成し、当該音声フレーズに種々のコンテンツデータを関連付けて提供することを目的とする。
【課題を解決するための手段】
【0007】
[1]
コンテンツデータが入力されると、対応する音声データを生成する音声生成装置であって、
以下の構成を備えることを特徴とする音声生成装置。
(1)以下の構成で構築されるパケットデータが記憶手段に記憶されている。
(a)(n+2)個(n≧1)の音情報記憶スロットからなる(n+2)音1拍を一単位とする音情報記憶領域
(b)1音を構成する音名コードに対応する第一の音属性コードが、1番目の前記音情報記憶スロットに設定される。
(c)(n+2)個未満の複数音を構成する音名コードに対応する第二の音属性コードが、以下の条件で前記音情報記憶スロットに設定される。
(c1)前記1番目の音情報記憶スロットに設定される。
(c2)n=1の場合、2番目又は3番目の音情報記憶スロットに設定される。
(c3)n≧2の場合、偶数番目、奇数番目及び(n+2)番目の音情報記憶スロットの中から選択される一つの前記音情報記憶スロットに設定される。
(c4)n≧2の場合、さらに、偶数番目、奇数番目及び(n+2)番目の前記音情報記憶スロットの中から選択される複数の前記音情報記憶スロットの組み合わせに設定される。
(d)(n+2)個の音を構成する音名コードに対応する第三の音属性コードが、すべての前記音情報記憶スロットに設定される。
(2)以下の手順に従って、入力された前記コンテンツデータに対応する(n+2)音1拍を一単位とする音声データを生成する音声生成手段
(a)入力された前記コンテンツデータを前記第一の音属性コード、前記第二の音属性コード及び前記第三の音属性コードの少なくとも一方と関連付けて前記パケットデータを生成する処理を行う。
(b)前記パケットデータに対応する前記音名コードで構成される前記音声データを生成する処理を行う。
【0008】
[2]
コンテンツデータが入力されると、対応する音声データを生成する音声生成装置と、前記音声データを前記音声生成装置から受信する受信端末と、を備える音声生成システムであって、
以下の構成を備えることを特徴とする音声生成システム。
(1)前記音声生成装置は、以下の構成で構築されるパケットデータを記憶している記憶手段を備えている。
(a)(n+2)個(n≧1)の音情報記憶スロットからなる(n+2)音1拍を一単位とする音情報記憶領域
(b)1音を構成する音名コードに対応する第一の音属性コードが、1番目の前記音情報記憶スロットに設定される。
(c)(n+2)個未満の複数音を構成する音名コードに対応する第二の音属性コードが、以下の条件で前記音情報記憶スロットに設定される。
(c1)前記1番目の音情報記憶スロットに設定される。
(c2)n=1の場合、2番目又は3番目の音情報記憶スロットに設定される。
(c3)n≧2の場合、偶数番目、奇数番目及び(n+2)番目の音情報記憶スロットの中から選択される一つの前記音情報記憶スロットに設定される。
(c4)n≧2の場合、さらに、偶数番目、奇数番目及び(n+2)番目の前記音情報記憶スロットの中から選択される複数の前記音情報記憶スロットの組み合わせに設定される。
(d)(n+2)個の音を構成する音名コードに対応する第三の音属性コードが、すべての前記音情報記憶スロットに設定される。
(2)前記音声生成装置は、以下の手順に従って、入力された前記コンテンツデータに対応する(n+2)音1拍を一単位とする音声データを生成する音声生成手段を備えている。
(a)入力された前記コンテンツデータを前記第一の音属性コード、前記第二の音属性コード及び前記第三の音属性コードの少なくとも一方と関連付けて前記パケットデータを生成する処理を行う。
(b)前記パケットデータに対応する前記音名コードで構成される前記音声データを生成する処理を行う。
(3)前記音声生成装置は、前記生成された音声データを出力する音声データ出力手段を備える。
(4)前記受信端末は、前記生成された音声データを、前記コンテンツデータに変換するデータ変換手段を備える。
【発明の効果】
【0009】
この発明によれば、入力された文字データや記号データ及びこれらの組み合わせに対してリズムの変化を有する音声フレーズを生成し、当該音声フレーズに種々のコンテンツデータを関連付けて提供することができる。
【図面の簡単な説明】
【0010】
図1】(a)本実施形態の音声生成装置及び音声生成システムを構成する受信端末のハードウェア構成の一例、(b)本実施形態の音声生成装置のソフトウェア構成の一例を表す図、(c)本実施形態の音声生成システムを構成する受信端末のソフトウェア構成の一例を表す図
図2】(a)音情報記憶領域の一例を表す図、(b)音名コードと変換コードの対応関係の一例を表す図、(c)パケットデータの一例を表す図、(d)音声データの一例を表す図
図3】(a)1音マトリクスの一例を表す図、(b)2音マトリクスの一例を表す図、(c)3音マトリクスの一例を表す図
図4】(a)音情報記憶領域の他の一例を表す図、(b)音名コードと変換コードの対応関係の一例を表す図、(c)パケットデータの他の一例を表す図、(d)音声データの他の一例を表す図
図5】(a)1音マトリクスの一例を表す図、(b)2音マトリクスの一例を表す図、(c)3音マトリクスの一例を表す図、(d)4音マトリクスの一例を表す図
図6】(a)音情報記憶領域の他の一例を表す図、(b)音名コードと変換コードの対応関係の他の一例を表す図
図7】音属性コードの配列パターンの類型を表す図
図8】サウンドIDの構成を説明する図
図9】パケットデータの階層構造の一例を表す図
図10】入力データから音声データを生成する説明の一例を表す図
図11】パケットデータの階層構造における入力データから音声データを生成する説明の一例を表す図
図12図11に続き、入力データから音声データを生成する説明の一例を表す図
図13】コンテンツデータの階層構造の一例を表す図
図14】本実施形態の音声生成システムによる処理の一例を表すフロー図
【発明を実施するための形態】
【0011】
以下、添付図面を参照して本発明の実施形態の一例を説明する。本実施形態の一態様である音声生成装置は、文字データ、記号データ、画像データ、映像データ又はこれらの組み合わせからなるコンテンツデータ(以下、「入力データ」ということがある。)に対応する音声データを生成する機器又はサーバである。
【0012】
本実施形態の音声生成装置による音声生成プロセスとしては以下の態様を例示できる。
・本実施形態の音声生成装置が入力データを受け付け、対応する音声データを生成及び出力する態様
・本実施形態の音声生成装置が入力データを受け付け、対応する音声データを生成し、当該音声データを受信端末である外部の出力機器又は装置に送信し出力させる態様
・外部の入力機器又は装置から入力データを本実施形態の音声生成装置が受信し、対応する音声データを生成及び出力する態様
・外部の入力機器又は装置から入力データを本実施形態の音声生成装置が受信し、対応する音声データを生成し、当該音声データを受信端末である外部の出力機器又は装置に送信し出力させる態様
本実施形態では、文字データには日本語のかな文字や他の言語体系の文字のデータが含まれ、記号データには、濁点、半濁点、長音、句読点、数字及びその他の記号のデータが含まれるものとして説明する。
【0013】
また、本実施形態には、この実施形態で説明する音声生成システムとしてコンピュータを機能させるコンピュータプログラムを含む。
【0014】
本実施形態で説明する音声生成装置及び受信端末には本実施形態の音声生成システムによる音声生成サービスに係るアプリケーションソフトウェアがインストールされている。このアプリケーションソフトウェアを実行することで、入力データに対応する音声データを生成し出力すること及び音声データから入力データへの変換処理ができる。
【0015】
[音声生成装置]
本実施形態の音声生成装置1はパーソナルコンピュータ、スマートフォン、タブレット、等の端末機器や、ミュージックシーケンサー、MIDIコントローラ、シンセサイザー、ミュージックワークステーション、等のMIDIデータやオーディオデータを扱える電子機器や、サーバ装置である。
【0016】
ハードウェア構成として図1(a)に示すように、各種コンピュータプログラムの実行及び演算処理を行うCPU2、RAM、ROMといった各種データを記憶するメモリ3、内蔵ストレージ等の補助記憶装置4、MIDIケーブル等の有線接続や、インターネット通信網、無線通信規格で定められている無線通信網によるネットワーク接続、等の通信手段を介して外部の入力機器及び出力機器との間で各種情報を送受信する通信モジュール5、マウス、キーボード、タッチパネル等の入力装置6及び液晶ディスプレイ、スピーカ等の出力装置7を備えている。
【0017】
また、音声生成装置1はソフトウェア構成として図1(b)に示すように、データ入力部101、データ受信部102、記憶部103、音声データ生成部105及び音声データ出力部106を備えている。CPU2及びメモリ3等が協働することでこれらの処理部による情報処理が制御される。
【0018】
データ入力部101は、例えば事業者等のデータ入力者が音声生成装置1を上記端末機器や電子機器として使用する際に、コンテンツデータの入力ウインドウを表示画面に表示し、入力データを受け付ける処理を行う。
【0019】
データ受信部102は、上述した外部の入力機器又は装置から送信される入力データを受信する処理を行う。なお、上記外部の入力機器又は装置は、パーソナルコンピュータ、スマートフォン、タブレット、等の端末機器や、ミュージックシーケンサー、MIDIコントローラ、シンセサイザー、ミュージックワークステーション、等のMIDIデータやオーディオデータを扱える電子機器である。
【0020】
記憶部103には、パケットデータ17が記憶されている。本実施形態のパケットデータ17は、(n+2)個(n≧1)の音情報記憶スロットからなる(n+2)音1拍を一単位とする音情報記憶領域を備えている。パケットデータ17の構成例を以下に示す。
【0021】
(パケットデータの構成例1)
図2に示すn=1の例では、パケットデータ17は、3つの音情報記憶スロット10a、10b、10cからなる3音1拍を一単位とする音情報記憶領域9を備えている。
【0022】
一番目の音情報記憶スロット10aには、図3(a)に示すような1音マトリクス11aが設定されている。
【0023】
1音マトリクス11aは、1音に対応する変換コード12を10通り設定可能なマトリクスとなっている。図2(b)、(c)及び図3(a)に示すように、一番目の音情報記憶スロット10aに、1音に対応する第一の音属性コード(1音属性コード)13を0から9の10種類の変換コード12を用いて10通り設定することができる。以下、変換コード12が設定されていない音情報記憶スロット10には休符を表す休符コードが設定される。
【0024】
第一の音属性コード13に音名コード16が関連付けられる。例えば図2(d)に示すように、一番目の音情報記憶スロット10aに設定されている第一の音属性コード13「0」に音名「ド(C)」を表す音名コード16が関連付けられる。
【0025】
一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせ又は一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cの組み合わせには、図3(b)に示すような2音マトリクス11bが設定されている。
【0026】
2音マトリクス11bは、2音に対応する変換コード12を200通り設定可能なマトリクスとなっている。図2(b)、(c)及び図3(b)に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせ及び一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cの組み合わせに、2音に対応する第二の音属性コード(2音属性コード)14を0から9の10種類の変換コード12を用いて200通り設定することができる。
【0027】
第二の音属性コード14に音名コード16が関連付けられる。例えば図2(d)に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせに設定されている第二の音属性コード14「24」に音名「ミソ(EG)」を表す二つの音名コード16が関連付けられる。
【0028】
一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b及び三番目の音情報記憶スロット10cの組み合わせには、図3(c)に示すような3音マトリクス11cが設定されている。
【0029】
3音マトリクス11cは、3音に対応する変換コード12を1000通り設定可能なマトリクスとなっている。図2(b)、(c)及び図3(c)に示すように、一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b及び三番目の音情報記憶スロット10cの組み合わせに、3音を表す第三の音属性コード(3音属性コード)15を0から9の10種類の変換コード12を用いて1000通り設定することができる。
【0030】
第三の音属性コード15に音名コード16が関連付けられる。例えば図2(d)に示すように、一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b及び三番目の音情報記憶スロット10cの組み合わせに設定されている第三の音属性コード15「015」に音名「ドレラ(CDA)」を表す三つの音名コード16が関連付けられる。
【0031】
上記第一の音属性コード13、第二の音属性コード14及び第三の音属性コード15の少なくとも一方にコンテンツデータが関連付けられたパケットデータ17が記憶部103に記憶される。
【0032】
以上から、n=1の場合、パケットデータ17は以下の構成で構築され、1210種類のコンテンツデータを設定することができる。
(a)3つの音情報記憶スロット10からなる3音1拍を一単位とする音情報記憶領域9
(b)1音を構成する音名コードに対応する第一の音属性コード13が、1番目の音情報記憶スロット10aに設定される。
(c)2音を構成する音名コードに対応する第二の音属性コード14が、以下の音情報記憶スロット10に設定される。
(c1)1番目の音情報記憶スロット10a
(c2)2番目の音情報記憶スロット10b又は3番目の音情報記憶スロット10c
(d)3音を構成する音名コードに対応する第三の音属性コード15が、音情報記憶スロット10a、10b、10cに設定される。
【0033】
(パケットデータの構成例2)
図4に示すn=2の例では、パケットデータ17は、4つの音情報記憶スロット10からなる4音1拍を一単位とする音情報記憶領域9を備えている。
【0034】
一番目の音情報記憶スロット10aには、図5(a)に示すような1音マトリクス11aが設定されている。
【0035】
1音マトリクス11aは、1音に対応する変換コード12を10通り設定可能なマトリクスとなっている。図4(b)、(c)及び図5(a)に示すように、一番目の音情報記憶スロット10aに、1音に対応する第一の音属性コード(1音属性コード)13を0から9の10種類の変換コード12を用いて10通り設定することができる。
【0036】
第一の音属性コード13に音名コード16が関連付けられる。例えば図4(d)に示すように、一番目の音情報記憶スロット10aに設定されている第一の音属性コード13「0」に音名「ド(C)」を表す音名コード16が関連付けられる。
【0037】
一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせ、一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cの組み合わせ又は一番目の音情報記憶スロット10aと四番目の音情報記憶スロット10dの組み合わせには、それぞれ図5(b)に示すような2音マトリクス11bが設定されている。
【0038】
2音マトリクス11bは、2音に対応する変換コード12を300通り設定可能なマトリクスとなっている。図4(b)、(c)及び図5(b)に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせ、一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cの組み合わせ及び一番目の音情報記憶スロット10aと四番目の音情報記憶スロット10dの組み合わせに、2音に対応する第二の音属性コード(2音属性コード)14aを0から9の10種類の変換コード12を用いて300通り設定することができる。
【0039】
第二の音属性コード14aに音名コード16が関連付けられる。例えば図4(d)に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせに設定されている第二の音属性コード14a「24」に音名「ミソ(EG)」を表す二つの音名コード16が関連付けられる。
【0040】
一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと三番目の音情報記憶スロット10cの組み合わせ、一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cと四番目の音情報記憶スロット10dの組み合わせ又は一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10b及び四番目の音情報記憶スロット10dには、それぞれ図5(c)に示すような3音マトリクス11cが設定されている。
【0041】
3音マトリクス11cは、3音に対応する変換コード12を3000通り設定可能なマトリクスとなっている。例えば図4(b)、(c)及び図5(c)に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと三番目の音情報記憶スロット10cの組み合わせ、一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cと四番目の音情報記憶スロット10dの組み合わせ及び一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと四番目の音情報記憶スロット10dの組み合わせに、3音に対応する第二の音属性コード(3音属性コード)14bを0から9の10種類の変換コード12を用いて3000通り設定することができる。
【0042】
第二の音属性コード14bに音名コード16が関連付けられる。例えば図4(d)に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと三番目の音情報記憶スロット10cの組み合わせに設定されている第二の音属性コード14b「015」に音名「ドレラ(CDA)」を表す三つの音名コード16が関連付けられる。
【0043】
一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせには、図5(d)に示すような4音マトリクス11dが設定されている。
【0044】
4音マトリクス11dは、4音に対応する変換コード12を10000通り設定可能なマトリクスとなっている。図4(b)、(c)及び図5(d)に示すように、一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせに、4音に対応する第三の音属性コード(4音属性コード)15を0から9の10種類の変換コード12を用いて10000通り設定することができる。
【0045】
第三の音属性コード15に音名コード16が関連付けられる。例えば、図4(d)に示すように、一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせに設定されている第三の音属性コード15「0153」に音名「ドレラファ(CDAF)」を表す4つの音名コード16が関連付けられる。
【0046】
上記第一の音属性コード13、第二の音属性コード14a、14b及び第三の音属性コード15の少なくとも一方にコンテンツデータが関連付けられたパケットデータ17が記憶部103に記憶される。
【0047】
以上から、n=2の場合、パケットデータ17は以下の構成で構築され、13310種類のコンテンツデータを設定することができる。
(a)4つの音情報記憶スロット10からなる4音1拍を一単位とする音情報記憶領域9
(b)1音を構成する音名コードに対応する第一の音属性コード13が、1番目の音情報記憶スロット10aに設定される。
(c)2音及び3音を構成する音名コードに対応する第二の音属性コード14a、14bが、以下の音情報記憶スロット10に設定される。
(c1)1番目の音情報記憶スロット10a
(c2)2番目(偶数番目)の音情報記憶スロット10b又は3番目(奇数番目)の音情報記憶スロット10c
(c3)2番目(偶数番目)の音情報記憶スロット10b、3番目(奇数番目)の音情報記憶スロット10c及び4番目((n+2)番目)の音情報記憶スロット10dの中から選択される複数の音情報記憶スロット10
(d)4音を構成する音名コードに対応する第三の音属性コード15が、音情報記憶スロット10a、10b、10c、10dに設定される。
【0048】
また、パケットデータの構成例1及び構成例2から、n≧2の場合、パケットデータ17は以下の構成で構築されることとなる。
(a)(n+2)個の音情報記憶スロット10からなる(n+2)音1拍を一単位とする音情報記憶領域9
(b)1音を構成する音名コードに対応する第一の音属性コード13が、1番目の音情報記憶スロット10aに設定される。
(c)(n+2)個未満の複数音を構成する音名コードに対応する第二の音属性コード14が、以下の音情報記憶スロット10に設定される。
(c1)1番目の音情報記憶スロット10a
(c2)偶数番目の音情報記憶スロット10、奇数番目の音情報記憶スロット10及び(n+2)番目の音情報記憶スロット10の中から選択される一つの音情報記憶スロット10
(c3)上記(c2)のほか、偶数番目の音情報記憶スロット10、奇数番目の音情報記憶スロット10及び(n+2)番目の音情報記憶スロット10の中から選択される複数の音情報記憶スロット10の組み合わせ
(d)(n+2)音を構成する音名コードに対応する第三の音属性コード15が、すべての音情報記憶スロット10に設定される。
【0049】
(パケットデータの構成例3)
図6図8に示す例では、パケットデータ17は、4つの音情報記憶スロット10からなる4音1拍を一単位とする音情報記憶領域9を備えている。
【0050】
一番目の音情報記憶スロット10aには、1音マトリクス11aが設定されている。
【0051】
1音マトリクス11aは、1音に対応する変換コード12を25通り設定可能なマトリクスとなっている。具体的には、一番目の音情報記憶スロット10aに、1音に対応する第一の音属性コード(1音属性コード)13を図6(b)に示す25種類の変換コード12を用いて25通り設定することができる。
【0052】
また、第一の音属性コード13が設定されたパケットデータ17には、図7に示すようにパターンコード20「a」が付与される。パターンコード20は第一の音属性コード13、第二の音属性コード14及び第三の音属性コード15の4つの音情報記憶スロット10への設定パターンを表す。
【0053】
第一の音属性コード13は、図7に示すように一番目の音情報記憶スロット10aに設定されるので、パターンコード20は1種類となる。
【0054】
第一の音属性コード13に音名コード16が関連付けられる。例えば図6(b)及び図7に示すように、一番目の音情報記憶スロット10aに設定されている第一の音属性コード13「1」に音名「ド(C)」を表す音名コード16が関連付けられる。
【0055】
一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせ、一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cの組み合わせ又は一番目の音情報記憶スロット10aと四番目の音情報記憶スロット10dの組み合わせには、2音マトリクス11bが設定されている。
【0056】
2音マトリクス11bは、2音に対応する変換コード12を1875通り設定可能なマトリクスとなっている。具体的には、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせ、一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cの組み合わせ及び一番目の音情報記憶スロット10aと四番目の音情報記憶スロット10dの組み合わせに、2音に対応する第二の音属性コード(2音属性コード)14aを図6(b)に示す25種類の変換コード12を用いて1875(625×3)通り設定することができる。
【0057】
また、第二の音属性コード14aが設定されたパケットデータ17には、図7に示すようにパターンコード20「b」、「c」、「d」の何れかが付与される。
【0058】
第二の音属性コード14aは、図7に示すように一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせ、一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cの組み合わせ又は一番目の音情報記憶スロット10aと四番目の音情報記憶スロット10dの組み合わせに設定されるので、パターンコード20は3種類となる。
【0059】
第二の音属性コード14aに音名コード16が関連付けられる。例えば図6(b)及び図7に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bの組み合わせに設定されている第二の音属性コード14a「12」に音名「ドド(CC)」を表す二つの音名コード16が関連付けられる。
【0060】
一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと三番目の音情報記憶スロット10cの組み合わせ、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10b及び四番目の音情報記憶スロット10d又は一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cと四番目の音情報記憶スロット10dの組み合わせには、3音マトリクス11cが設定されている。
【0061】
3音マトリクス11cは、3音に対応する変換コード12を46875通り設定可能なマトリクスとなっている。具体的には、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと三番目の音情報記憶スロット10cの組み合わせ、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと四番目の音情報記憶スロット10dの組み合わせ及び一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10cと四番目の音情報記憶スロット10dの組み合わせに、3音に対応する第二の音属性コード(3音属性コード)14bを図6(b)に示す25種類の変換コード12を用いて46875(15625×3)通り設定することができる。
【0062】
また、第二の音属性コード14bが設定されたパケットデータ17には、図7に示すようにパターンコード20「e」、「f」、「g」の何れかが付与される。
【0063】
第二の音属性コード14bは、図7に示すように一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと三番目の音情報記憶スロット10cの組み合わせ、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと四番目の音情報記憶スロット10dの組み合わせ又は一番目の音情報記憶スロット10aと三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせに設定されるので、パターンコード20は3種類となる。
【0064】
第二の音属性コード14bに音名コード16が関連付けられる。例えば図6(b)及び図7に示すように、一番目の音情報記憶スロット10aと二番目の音情報記憶スロット10bと三番目の音情報記憶スロット10cの組み合わせに設定されている第二の音属性コード14b「123」に音名「ドドレ(CCD)」を表す三つの音名コード16が関連付けられる。
【0065】
一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせには、4音マトリクス11dが設定されている。
【0066】
4音マトリクス11dは、4音に対応する変換コード12を390625通り設定可能なマトリクスとなっている。具体的には、一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせに、4音に対応する第三の音属性コード(4音属性コード)15を図6(b)に示す25種類の変換コード12を用いて390625通り設定することができる。
【0067】
第三の音属性コード15に音名コード16が関連付けられる。例えば、図6(b)及び図7に示すように、一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせに設定されている第三の音属性コード15「1234」に音名「ドドレレ(CCDD」を表す4つの音名コード16が関連付けられる。
【0068】
また、第三の音属性コード15が設定されたパケットデータ17には、図7に示すようにパターンコード20「h」が付与される。
【0069】
第三の音属性コード15は、図7に示すように一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dの組み合わせに設定されるので、パターンコード20は1種類となる。
【0070】
上記第一の音属性コード13、第二の音属性コード14a、14b及び第三の音属性コード15の少なくとも一方にコンテンツデータが関連付けられたパケットデータ17が記憶部103に記憶される。この構成例のパケットデータ17では、439400種類のコンテンツデータを設定することができる。
【0071】
また、この構成例では、パターンコード20と第一の音属性コード13の組み合わせ、パターンコード20と第二の音属性コード14a、14bの組み合わせ又はパターンコード20と第三の音属性コード15の組み合わせにフレーズコード21が付与され、複数のフレーズコード21がサウンドID22として設定されている。
【0072】
図8に示す例では、3つのフレーズコード21をサウンドID22として設定している。これにより、フレーズコード21の数と音名コード16が固定された特定のメロディをサウンドID22として設定することができる。
【0073】
(パケットデータの構成例4)
この構成例では、上記構成例1から構成例3で説明したパケットデータに係る音情報記憶領域に、別のパケットデータに係る音声情報記憶領域が設定されている。
【0074】
図9に示す例では、1音マトリクス11a、2音マトリクス11b及び3音マトリクス11cが設定されている音情報記憶領域9を備える3つのパケットデータ17a、17b、17cが階層化されている。図9では、以下の階層構造が形成されている。
・パケットデータ17aに係る音情報記憶領域9aの各音情報記憶スロット10に、パケットデータ17bに係る音情報記憶領域9bが設定されている。
・パケットデータ17bに係る音情報記憶領域9bの各音情報記憶スロット10に、パケットデータ17cに係る音情報記憶領域9cが設定されている。
【0075】
このような構成によりメロディによる情報のツリー化、情報のインデックス化が可能となる。
【0076】
上記と同様の効果が得られるのであれば、1音マトリクス11a、2音マトリクス11b、3音マトリクス11c及び4音マトリクス11dが設定されている音情報記憶領域9を備える4つのパケットデータ17a、17b、17c、17dを階層化してもよい。この場合、以下の階層構造が形成される。
・パケットデータ17aに係る音情報記憶領域9aの各音情報記憶スロット10に、パケットデータ17bに係る音情報記憶領域9bが設定される。
・パケットデータ17bに係る音情報記憶領域9bの各音情報記憶スロット10に、パケットデータ17cに係る音情報記憶領域9cが設定される。
・パケットデータ17cに係る音情報記憶領域9cの各音情報記憶スロット10に、パケットデータ17dに係る音情報記憶領域9dが設定される。
【0077】
音声データ生成部105は、入力データに対応する音声データを生成する処理を行う。本実施形態では以下のように入力データを処理して音声データを生成する。
【0078】
(1)パケットデータ17が、上記パケットデータの構成例1で説明した1音マトリクス11a、2音マトリクス11b及び3音マトリクス11cで構成されている場合、入力データは第一の音属性コード13、第二の音属性コード14及び第三の音属性コード15の少なくとも一方と関連付けられる。
【0079】
例えば、図10に示すように、文字データ「Thank you」が入力された場合、以下の処理が行われる。
【0080】
(a1)文字データ「T」、「n」及び「o」がそれぞれパケットデータ17の一番目の音情報記憶スロット10aに割り当てられ、1音に対応する第一の音属性コード13「0」、「6」及び「2」と関連付けられる。
【0081】
(a2)文字データ「h」、「k」及び「u」がそれぞれパケットデータ17の一番目の音情報記憶スロット10a及び二番目の音情報記憶スロット10bに割り当てられ、2音に対応する第二の音属性コード14「12」、「78」及び「34」と関連付けられる。
【0082】
(a3)文字データ「a」及び「y」がそれぞれパケットデータ17の一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b及び三番目の音情報記憶スロット10cに割り当てられ、3音に対応する第三の音属性コード15「345」及び「901」と関連付けられる。
上記のほか、以下の処理を行うことができる。
【0083】
(b1)一番目、四番目、七番目のパケットデータ17の一番目の音情報記憶スロット10aに、それぞれ1音に対応する第一の音属性コード13「0」、「6」及び「2」が設定される。
【0084】
(b2)二番目、五番目、八番目のパケットデータ17の一番目の音情報記憶スロット10a及び二番目の音情報記憶スロット10bに、それぞれ2音に対応する第二の音属性コード14「12」、「78」及び「34」が設定される。
【0085】
(b3)三番目、六番目のパケットデータ17の一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b及び三番目の音情報記憶スロット10cに、それぞれ3音に対応する第三の音属性コード15「345」及び「901」が設定される。
【0086】
(b4)第一の音属性コード13、第二の音属性コード14及び第三の音属性コード15の組み合わせ「0 12 345 6 78 901 2 34」に「Thank you」が関連付けられる。
【0087】
音声データ生成部105は、上記関連付けられた音属性コードで構成される一乃至複数の音声データを生成する処理を行う。
【0088】
例えば、図2(b)及び図10に示すように、第一の音属性コード13「0」、「6」、「2」に対応する「C(ド)」、「B(シ)」、「E(ミ)」と、第二の音属性コード14「12」、「78」、「34」に対応する「DE(レミ)」、「C2D2(ド2レ2)」、「FG(ファソ)」と、第三の音属性コード15「345」、「901」に対応する「FGA(ファソラ)」、「E2CD(ミ2ドレ)」を表す音名コード16で構成される3音1拍で8フレーズの音声データ19を生成する処理を行う。
【0089】
(2)パケットデータ17が、上記パケットデータの構成例3で説明した1音マトリクス11a、2音マトリクス11b、3音マトリクス11c及び4音マトリクス11dで構成され、上記パケットデータの構成例4で説明したパケットデータに係る音情報記憶領域の各音情報記憶スロット10に、別のパケットデータに係る音声情報記憶領域が設定されている場合、入力データは、階層化されている音情報記憶領域の第一の音属性コード13、第二の音属性コード14及び第三の音属性コード15の少なくとも一方と関連付けられる。
【0090】
図11に示す例では、1音マトリクス11a、2音マトリクス11b、3音マトリクス11c及び4音マトリクス11dが設定されている音情報記憶領域9を備える2つのパケットデータ17a、17bが階層化されている。第一階層目のパケットデータ17aに係る音情報記憶領域9aの音情報記憶スロット10aに、第二階層目のパケットデータ17bに係る音情報記憶領域9bが設定されている。
【0091】
また、第一階層目の各パケットデータ17aには図7に示すパターンコード20「g」、「b」、「h」及びフレーズコード21「g359」、「b13」、「hKMNW」が付与され、3つのフレーズコード21をサウンドID22として設定している。さらに、第二階層目のパケットデータ17bには図7に示すパターンコード20「d」及びフレーズコード21「d4P」が付与されている。
【0092】
この場合において、例えばローマ字及び記号の組み合わせで構成される所定のWebサイトのアドレスや、商品へのリンク先のアドレスが入力されると、以下の処理が行われる。
【0093】
(a1)Webサイトのアドレスのうち、文字データ「www.」の部分が第一階層目の一番目のパケットデータ17aの一番目の音情報記憶スロット10a、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dに割り当てられ、3音に対応する第二の音属性コード14b「359」と関連付けられる。
【0094】
(a2)Webサイトのアドレスのうち、文字データ「XYZ.」の部分が第一階層目の二番目のパケットデータ17aの一番目の音情報記憶スロット10a及び二番目の音情報記憶スロット10bに割り当てられ、2音に対応する第二の音属性コード14a「13」と関連付けられる。
【0095】
(a3)Webサイトのアドレスのうち、文字データ「co.jp」の部分が第一階層目の三番目のパケットデータ17aの一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dに割り当てられ、4音に対応する第三の音属性コード15「KMNW」と関連付けられる。
【0096】
(a4)HPからのリンク先となる商品情報のページのアドレスのうち、文字データ「/pro」の部分が第二階層目のパケットデータ17bの一番目の音情報記憶スロット10a及び四番目の音情報記憶スロット10dに割り当てられ、2音に対応する第二の音属性コード14a「4P」と関連付けられる。
上記のほか、以下の処理を行うことができる。
【0097】
(b1)第一階層目の第二の音属性コード14a、14b及び第三の音属性コード15の組み合わせ「359 13 KMNW」にWebサイトのアドレス「www.XYZ.co.jp」が関連付けられる。
【0098】
(b2)第二階層目の第二の音属性コード14a「4P」に商品情報のページのアドレスのうち、文字データ「/pro」の部分が関連付けられる。
【0099】
音声データ生成部105は、上記関連付けられた音属性コードで構成される一乃至複数の音声データを生成する処理を行う。
【0100】
例えば、図6(b)及び図11に示すように、第二の音属性コード14b「359」に対応する「DEG(レミソ)」と、第二の音属性コード14a「13」に対応する「CD(ドレ)」と、第三の音属性コード15「KMNW」に対応する「ABC2A2(ラシド2ラ2)」を表す音名コード16で構成される4音1拍で3フレーズの音声データ19aと、第二の音属性コード14a「4P」に対応する「DD2(レレ2)」を生成する処理を行う。
【0101】
図11の例では、ある事業者のHPを4音1拍で3フレーズのパケットデータ17aからなる音声データ19aで表し、これをサウンドID22として固定化している。また、リンク先となる商品情報のページを4音1拍で1フレーズのパケットデータ17bからなる音声データ19bで表し、これをサウンドID22に紐づけている。
【0102】
そこで、図13に示すように、ある事業者XYZのHPを想起させる音声データ19をサウンドID22として設定し、上記HPからのリンク先となる種々のページを表す音声データ19をフレーズコード21として設定することで、情報を音声で階層化することができる。また、音声データ19をサウンドID22として設定することで特定の者を識別するサウンドのドメインが付与されたことになる。
【0103】
音声データ出力部106は、音声データ生成部105が生成した音声データ19を音声で出力する処理を行う。なお、音声データ19を出力する際に入力データを表示画面に表示することもできる。
【0104】
[受信端末]
本実施形態の受信端末8はパーソナルコンピュータ、スマートフォン、タブレット、等の端末機器である。
【0105】
ハードウェア構成として図1(a)に示すように、各種コンピュータプログラムの実行及び演算処理を行うCPU2、RAM、ROMといった各種データを記憶するメモリ3、内蔵ストレージ等の補助記憶装置4、インターネット通信網、無線通信規格で定められている無線通信網によるネットワーク接続、等の通信手段を介して外部の音声生成装置1との間で各種情報を送受信する通信モジュール5、マウス、キーボード、タッチパネル、マイクロフォン等の入力装置6及び液晶ディスプレイ、スピーカ等の出力装置7を備えている。
【0106】
また、受信端末8はソフトウェア構成として図1(c)に示すように、データ受信部801、記憶部802及びデータ変換部803を備えている。CPU2及びメモリ3等が協働することでこれらの処理部による情報処理が制御される。
【0107】
データ受信部801は、音声生成装置1から出力される音声データ19を受信する処理を行う。
【0108】
記憶部802には、パケットデータ17が記憶されている。パケットデータ17の構成については音声生成装置1での説明と同様であるので省略する。
データ変換部803は、受信した音声データ19を音声生成装置1で入力されたコンテンツデータに変換する処理を行う。
【0109】
例えば、音声データ19が図10に示す「C(ド)」、「DE(レミ)」、「FGA(ファソラ)」、「B(シ)」、「C2D2(ド2レ2)」、「E2CD(ミ2ドレ)」「E(ミ)」、「FG(ファソ)」、で構成される3音1拍で8フレーズの音声データ19の場合、各音の音名コード16に設定されている第一の音属性コード13「0」、「6」、「2」と、第二の音属性コード14「12」、「78」、「34」と、第三の音属性コード15「345」、「901」を判別し、各音属性コードが関連付けられている「Thank you」の文字データに変換する処理を行う。
【0110】
また、例えば、音声データ19が図11に示す「DEG(レミソ)」、「CD(ドレ)」、「ABC2A2(ラシド2ラ2)」、「DD2(レレ2)」で構成される4音1拍で4フレーズの音声データ19a、19bの場合、パケットデータ17aに設定されているサウンドID22のフレーズコード21と、パケットデータ17bに付与されているフレーズコード21から各音の音名コード16に設定されている第二の音属性コード14b「359」と、第二の音属性コード14a「13」と、第三の音属性コード15「KMNW」と、第二の音属性コード14a「4P」を判別し、各音属性コードが関連付けられている「www.XYZ.co.jp」のページ内容に変換する処理を行う。
【0111】
これら変換された情報は、受信端末8のディスプレイに表示される。
【0112】
[音声生成システムによる処理フロー]
図11図14を参照して、本実施形態の一態様である音声生成システムによる処理フローを説明する。この処理フローでは、一例としてコンビニエンスストアの所定の場所にタブレットである音声生成装置1が設置され、来店したユーザが所有する受信端末8であるスマートフォンで、音声生成装置1で生成された音声データを受信しコンテンツを表示する態様を説明する。また、パケットデータ17について、上記パケットデータの構成例3、4を組み合わせたものとして説明する。
【0113】
(S101)
音声生成装置1では、データ受信部102は、上述した外部の入力機器又は装置から送信される入力データとして例えば、「16時から飲み物1割引き!」を内容とするXYZのHP、対象商品一覧ページ、対象商品の割引ページを受信する処理を行う。
【0114】
(S102)
音声データ生成部105は以下の処理を行う。
図11に示すように、第一階層目の一番目のパケットデータ17aの一番目の音情報記憶スロット10a、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dに、3音に対応する第二の音属性コード14b「359」を設定する。
第一階層目の二番目のパケットデータ17aの一番目の音情報記憶スロット10a及び二番目の音情報記憶スロット10bに、2音に対応する第二の音属性コード14a「13」を設定する。
第一階層目の三番目のパケットデータ17aの一番目の音情報記憶スロット10a、二番目の音情報記憶スロット10b、三番目の音情報記憶スロット10c及び四番目の音情報記憶スロット10dに、4音に対応する第三の音属性コード15「KMNW」を設定する。
第一階層目の各パケットデータ17aに図7に示すパターンコード20「g」、「b」、「h」及びフレーズコード21「g359」、「b13」、「hKMNW」を付与し、3つのフレーズコード21をサウンドID22として設定する。
第一階層目の第二の音属性コード14a、14bと第三の音属性コード15の組み合わせ「359 13 KMNW」に、入力データ18aであるWebサイトのアドレス「www.XYZ.co.jp」を関連付ける。
図11に示すように、第二階層目のパケットデータ17bの一番目の音情報記憶スロット10a及び四番目の音情報記憶スロット10dに、2音に対応する第二の音属性コード14a「4P」を設定する。なお、第一階層目の一番目のパケットデータ17aの一番目の音情報記憶スロット10aに、第二階層目のパケットデータ17bに係る音情報記憶領域9bが設定されている。
第二階層目のパケットデータ17bに図7に示すパターンコード20「d」及びフレーズコード21「d4P」を付与し、このフレーズコード21をサウンドID22に紐づける。
第二階層目の第二の音属性コード14a「4P」に、入力データ18bであるHPからのリンク先となる対象商品一覧ページのアドレスのうち、文字データ「/pro」の部分を関連付ける。
図12に示すように、第三階層目のパケットデータ17cの一番目の音情報記憶スロット10a及び三番目の音情報記憶スロット10cに、2音に対応する第二の音属性コード14a「VK」を設定する。なお、第二階層目のパケットデータ17bの一番目の音情報記憶スロット10aに、第三階層目のパケットデータ17cに係る音情報記憶領域9cが設定されている。
第三階層目のパケットデータ17cに図7に示すパターンコード20「c」及びフレーズコード21「cVK」を付与し、このフレーズコード21をサウンドID22に紐づける。
第三階層目の第二の音属性コード14a「VK」に、入力データ18cである上記対象商品一覧ページからのリンク先となる対象商品の割引ページのアドレスのうち、文字データ「/a-discount」の部分を関連付ける。
【0115】
(S103)
音声データ生成部105はさらに以下の処理を行う。
第一階層目の第二の音属性コード14b「359」に対応する「DEG(レミソ)」と、第二の音属性コード14a「13」に対応する「CD(ドレ)」と、第三の音属性コード15「KMNW」に対応する「ABC2A2(ラシド2ラ2)」を表す音名コード16で構成される4音1拍で3フレーズの音声データ19aを生成する。
第二階層目の第二の音属性コード14a「4P」に対応する「DD2(レレ2)」を表す音名コード16で構成される4音1拍で1フレーズの音声データ19bを生成する。
第三階層目の第二の音属性コード14a「VK」に対応する「G2A(ソ2ラ)」を表す音名コード16で構成される4音1拍で1フレーズの音声データ19cを生成する。
【0116】
(S104)
音声データ出力部106は、音声データ生成部105が生成した音声データ19a、19b、19cを所定の期間、所定のタイミングで出力する処理を行う。例えば16時から17時で、1分間隔で音声データ19を出力する。
【0117】
(S105)
上記コンビニエンスストアに来店したユーザは、受信端末8を操作して上記アプリケーションソフトウェアを実行すると、データ受信部801が音声データ19a、19b、19cを受信する。
【0118】
(S106)
データ変換部803は以下の処理を行う。
パケットデータ17aに設定されているサウンドID22のフレーズコード21から各音の音名コード16に設定されている第二の音属性コード14b「359」と、第二の音属性コード14a「13」と、第三の音属性コード15「KMNW」を判別し、各音属性コードが関連付けられている「www.XYZ.co.jp」のページ内容に変換する処理を行う。
パケットデータ17bに付与されているフレーズコード21から各音の音名コード16に設定されている第二の音属性コード14a「4P」を判別し、第二の音属性コード14aが関連付けられている「www.XYZ.co.jp/pro/list」のページ内容に変換する処理を行う。
パケットデータ17cに付与されているフレーズコード21から各音の音名コード16に設定されている第二の音属性コード14a「VK」を判別し、第二の音属性コード14aが関連付けられている「www.XYZ.co.jp/pro/list/a-discount」のページ内容に変換する処理を行う。
【0119】
(S107)
変換された上記Webサイトや、対象商品一覧ページ、対象商品の割引ページが表示画面に表示され、上記ユーザはこれらのコンテンツの閲覧、利用等することができる。
【0120】
以上、本実施形態では、音属性コードを含む均一の時間軸を有する音情報記憶スロットで音情報記憶領域を構成しているので、情報のメロディ化及びメロディの情報化が可能となり、これら情報のエンコード及びデコードが可能となっている。
【0121】
特に、エンコード及びデコードする際に上記パケットデータが階層化(レイヤー化)されていることで、メロディによる情報のツリー化、インデックス化が可能となり、極めて多数の情報にアクセスすることが可能となる。
【0122】
そして、文字データ、記号データ、画像データ、映像データ又はこれらの組み合わせの少なくとも一方からなるコンテンツデータをメロディ化しているので、このメロディを受信端末で受信すれば当該メロディに紐づけされた具体的情報へ瞬時にアクセスすることができる。
【産業上の利用可能性】
【0123】
本実施形態に係る音声生成装置、音声生成システム及びコンピュータプログラムは、以下の活用例によって産業上の利用可能性に資するものとなっている。
・音楽言語体系の提供に活用
・メロディによる各種情報の提供に活用
・メロディによるインターネットに連動したアクセス情報の提供に活用
・音情報記憶スロットの事業者への提供に活用
・ラジオ、TV、公共交通機関等における音声による広告媒体に活用
・メロディのライセンス提供に活用
・情報のアーカイブ化に活用
・事業者専用の音声暗号に活用
【0124】
例えば本実施形態に係る音声生成システムにおいて、政府や官公庁、各地方自治体等のHPを特定するパケットデータ17を複数準備し、これらをサウンドID22として設定する。
サウンドID22に紐づくフレーズコード21に各種情報を関連付ける。
上記サウンドID22及びフレーズコード21からなる音声データ19を、各地域に設置されている防災スピーカで出力する。
地域住民は受信端末8であるスマートフォンを操作して音声データ19を受信する。
受信端末8には、上記音声データ19から変換された緊急情報(災害情報など)が表示される。
【0125】
このような活用例によって災害等の緊急事態時に一例として以下の効果が発揮される。
・災害等の現場周辺の個別地区情報等の言葉では伝えきれない情報を、音声データを用いて瞬時に提供、利用することができる。
・外国語での情報の提供、利用も可能である。
・停電下においても情報の取得が可能である。
【符号の説明】
【0126】
9 音情報記憶領域
10a-10d 音情報記憶スロット
11 n音マトリクス
11a 1音マトリクス
11b 2音マトリクス
11c 3音マトリクス
11d 4音マトリクス
12 変換コード
13 第一の音属性コード
14 第二の音属性コード
15 第三の音属性コード
16 音名コード
17 パケットデータ
18 入力データ
19 音声データ
20 パターンコード
21 フレーズコード
22 サウンドID
【要約】
入力された文字データや記号データ及びこれらの組み合わせに対してリズムの変化を有する音声フレーズを生成し、当該音声フレーズに種々のコンテンツデータを関連付けて提供すること
コンテンツデータが入力されると、対応する音声データを生成する音声生成装置であって、
以下の構成を備えることを特徴とする音声生成装置。
1音を構成する音名コードに対応する第一の音属性コード、複数音を構成する音名コードに対応する第二の音属性コード及び第三の音属性コードの少なくとも一方にコンテンツデータを関連付けてパケットデータを生成する。
前記パケットデータに対応する前記音名コードで構成される前記音声データを生成する処理を行う。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14