(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024121538
(43)【公開日】2024-09-06
(54)【発明の名称】音源形成システム、音源形成プログラム、および音源形成方法
(51)【国際特許分類】
G10L 13/02 20130101AFI20240830BHJP
G06F 3/16 20060101ALI20240830BHJP
G10L 15/10 20060101ALI20240830BHJP
【FI】
G10L13/02 130C
G06F3/16 690
G10L15/10 200W
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023028689
(22)【出願日】2023-02-27
(71)【出願人】
【識別番号】000223182
【氏名又は名称】TOA株式会社
(74)【代理人】
【識別番号】100163979
【弁理士】
【氏名又は名称】濱名 哲也
(72)【発明者】
【氏名】犬飼 一之
(72)【発明者】
【氏名】桑原 佑輔
(72)【発明者】
【氏名】許 志有
(72)【発明者】
【氏名】藤田 敏之
(57)【要約】
【課題】アナウンスなど、言葉を含む音声にあう音楽を選択することは、時間を要する作業となっている。
【解決手段】音源形成システム1は、言葉を含む音声に関する情報と、音楽がワードに関係付けられているデータとに基づいて、言葉を含む音声に関する情報に関連する音楽を選択する音楽選択部30を備える。また、音源形成システム1は合成部40を備える。合成部40は、言葉を含む音声に関する情報に係る音声データと、音楽選択部30によって選択された音楽と、を合成して音源を形成する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
音源を形成する音源形成システムであって、
ワードを含む音声関連情報と、音楽と関連ワードとが関係付けられている関係データとに基づいて、前記音声関連情報に関連する音楽を選択音楽として選択する音楽選択部と、
前記音声関連情報に係る音声データと前記選択音楽とを合成することによって音源を形成する合成部と、を備える、
音源形成システム。
【請求項2】
前記関係データにおける前記関連ワードと前記音声関連情報のワードとを照合するワード照合部をさらに備え、
前記音楽選択部は、前記ワード照合部による照合によって前記関連ワードと一致した一致ワードと、前記関係データと、に基づいて、前記一致ワードに関連する音楽を前記選択音楽として選択する、
請求項1に記載の音源形成システム。
【請求項3】
前記一致ワードからキーワードを選択するキーワード選択部をさらに備え、
前記音楽選択部は、前記キーワードと前記関係データとに基づいて、前記キーワードに関連する音楽を選択する、
請求項2に記載の音源形成システム。
【請求項4】
優先度データを有し、
前記優先度データは、複数の登録ワードを含み、複数の前記登録ワードそれぞれには、前記キーワードとして選択される優位性を示す優先度が付与され、
前記キーワード選択部は、前記優先度データを参照することによって前記一致ワードから前記キーワードを選択する、
請求項3に記載の音源形成システム。
【請求項5】
前記音声関連情報においてワードを照合する範囲を設定する範囲設定部をさらに備え、
前記ワード照合部は、前記音声関連情報において前記範囲設定部によって設定された前記範囲においてワードを照合する、
請求項2に記載の音源形成システム。
【請求項6】
前記音楽選択部は、前記一致ワードおよび追加情報と、前記関係データとに基づいて、前記一致ワードおよび前記追加情報に関連する音楽を前記選択音楽として選択する、
請求項2に記載の音源形成システム。
【請求項7】
前記追加情報は、音源使用時の予想天気、音源使用時の季節、音源使用の日に関する情報、音源使用時の場所、音源使用の場所にいる人の視覚的情報、音源使用時の時刻、音源使用の目的、音源使用の場所の音環境、音源使用の店舗のスタイル、音源使用の理念、音源使用する人または団体の施設、音源を聞きうる人の個人情報、および、任意に設定可能な追加キーワードの少なくとも1つである、
請求項6に記載の音源形成システム。
【請求項8】
前記関係データは、
テーブルまたは学習済データであり、
前記テーブルは、複数の音楽のそれぞれに前記関連ワードが紐づけられているデータであり、
前記学習済データは、予め互いに紐づけられた音楽とワードとのデータセットに基づく学習によって得られたデータである、
請求項1~7のいずれか一項に記載の音源形成システム。
【請求項9】
前記音声関連情報は、アナウンス文字情報、アナウンス音声情報、および音声情報の少なくとも1つを含む、
請求項1~7のいずれか一項に記載の音源形成システム。
【請求項10】
コンピュータに音源を形成させるための音源形成プログラムであって、
音楽と関連ワードとが関係付けられている関係データにおける前記関連ワードと、音声関連情報のワードと、を照合させるワード照合ステップと、
前記ワード照合ステップの照合によって一致した一致ワードと前記関係データとに基づいて、前記一致ワードに関連する音楽を選択音楽として選択させる音楽選択ステップと、
前記音声関連情報に係る音声データと前記選択音楽とを合成することによって音源を形成させる合成ステップと、
を前記コンピュータに実行させる、
音源形成プログラム。
【請求項11】
音源を形成する音源形成方法であって、
音楽と関連ワードとが関係付けられている関係データにおける前記関連ワードと、音声関連情報のワードと、を照合するワード照合工程と、
前記ワード照合工程の照合によって一致した一致ワードと前記関係データとに基づいて、前記一致ワードに関連する音楽を選択音楽として選択する音楽選択工程と、
前記音声関連情報に係る音声データと前記選択音楽とを合成することによって音源を形成する合成工程と、を含む、
音源形成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音源形成システム、音源形成プログラム、および音源形成方法に関する。
【背景技術】
【0002】
アナウンス音声にバックグラウンド・ミュージック(以下、BGM)を合成するボイスメール装置が知られている(例えば、特許文献1)。特許文献1に開示されるボイスメール装置は、アナウンス音声に、アナウンス音声に対して予め選択されたBGMを合成することによって、情報案内メッセージを形成する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、特許文献1に記載されているように、アナウンスなど、言葉を含む音声に音楽を付けることがある。しかし、言葉を含む音声にあう音楽を音楽のデータベースから選択することは、時間を要する作業となっている。
【課題を解決するための手段】
【0005】
(1)上記課題を解決する音源形成システムは、音源を形成する音源形成システムであって、ワードを含む音声関連情報と、音楽と関連ワードとが関係付けられている関係データとに基づいて、前記音声関連情報に関連する音楽を選択音楽として選択する音楽選択部と、前記音声関連情報に係る音声データと前記選択音楽とを合成することによって音源を形成する合成部と、を備える。この構成によれば、ワードを含む音声関連情報と、音楽と関連ワードとが関係付けられている関係データとに基づいて、音声関連情報に関連する音楽を選択できる。このため、音声関連情報の内容に適した音楽を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【0006】
(2)上記(1)の音源形成システムにおいて、前記関係データにおける前記関連ワードと前記音声関連情報のワードとを照合するワード照合部をさらに備え、前記音楽選択部は、前記ワード照合部による照合によって前記関連ワードと一致した一致ワードと、前記関係データと、に基づいて、前記一致ワードに関連する音楽を前記選択音楽として選択する。この構成によれば、ワード照合部は、関係データにおける関連ワードと音声関連情報のワードとを照合する。そして、音楽選択部は、照合の結果得られる一致ワードに関連する音楽を関係データから選択する。このように、関係データから音声関連情報に関連する音楽を選択できる。このため、音声関連情報の内容に適した音楽を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【0007】
(3)上記(2)の音源形成システムにおいて、前記一致ワードからキーワードを選択するキーワード選択部をさらに備え、前記音楽選択部は、前記キーワードと前記関係データとに基づいて、前記キーワードに関連する音楽を選択する。この構成によれば、キーワードに基づいて音楽を選択できる。これにより、音楽選択部は、音声関連情報の内容に適した音楽を選択し易い。
【0008】
(4)上記(3)の音源形成システムにおいて、優先度データを有し、前記優先度データは、複数の登録ワードを含み、複数の前記登録ワードそれぞれには、前記キーワードとして選択される優位性を示す優先度が付与され、前記キーワード選択部は、前記優先度データを参照することによって前記一致ワードから前記キーワードを選択する。この構成によれば、優位性の高いキーワードに基づいて音楽を選択できる。これにより、音楽選択部は、音声関連情報の内容に適した音楽を効率的に選択できる。
【0009】
(5)上記(2)の音源形成システムにおいて、前記音声関連情報においてワードを照合する範囲を設定する範囲設定部をさらに備え、前記ワード照合部は、前記音声関連情報において前記範囲設定部によって設定された前記範囲においてワードを照合する。この構成によれば、音声関連情報においてワードを照合する範囲を設定することができる。これにより、音源形成システムは、ワードを照合し終わるまでに要する時間を短縮できる。
【0010】
(6)上記(2)の音源形成システムにおいて、前記音楽選択部は、前記一致ワードおよび追加情報と、前記関係データとに基づいて、前記一致ワードおよび前記追加情報に関連する音楽を前記選択音楽として選択する。この構成によれば、音声関連情報と追加情報とに基づいて音楽を選択できる。このため、音楽選択部は、音楽をさらに効率的に選択できる。
【0011】
(7)上記(6)の音源形成システムにおいて、前記追加情報は、音源使用時の予想天気、音源使用時の季節、音源使用の日に関する情報、音源使用時の場所、音源使用の場所にいる人の視覚的情報、音源使用時の時刻、音源使用の目的、音源使用の場所の音環境、音源使用の店舗のスタイル、音源使用の理念、音源使用する人または団体の施設、音源を聞きうる人の個人情報、および、任意に設定可能な追加キーワードの少なくとも1つである。この構成によれば、音声関連情報だけでなく、これらの情報に基づいて音楽を選択できる。
【0012】
(8)上記(1)~(7)のいずれか一つの音源形成システムにおいて、前記関係データは、テーブルまたは学習済データであり、前記テーブルは、複数の音楽のそれぞれに関連ワードが紐づけられているデータであり、前記学習済データは、予め互いに紐づけられた音楽と関連ワードとのデータセットに基づく学習によって得られたデータである。この構成によれば、テーブルまたは学習済データに基づいて音楽を選択できる。
【0013】
(9)上記(1)~(7)のいずれか一つの音源形成システムにおいて、前記音声関連情報は、アナウンス文字情報、アナウンス音声情報、および音声情報の少なくとも1つを含む。この構成によれば、アナウンス文字情報、アナウンス音声情報、および音声情報の少なくとも1つを含む音声関連情報について、音声関連情報に適した音楽を選択できる。
【0014】
(10)上記課題を解決する音源形成プログラムは、コンピュータに音源を形成させるための音源形成プログラムであって、音楽と関連ワードとが関係付けられている関係データにおける前記関連ワードと、音声関連情報のワードと、を照合させるワード照合ステップと、前記ワード照合ステップによる照合によって一致した一致ワードと前記関係データとに基づいて、前記一致ワードに関連する音楽を選択音楽として選択させる音楽選択ステップと、前記音声関連情報に係る音声データと前記選択音楽とを合成することによって音源を形成させる合成ステップと、を前記コンピュータに実行させる。この構成によれば、ワード照合ステップは、関係データにおける関連ワードと音声関連情報のワードとを照合する。そして、音楽選択ステップは、照合によって得られる一致ワードに関連する音楽を選択する。このように、音声関連情報から一致ワードに関連する音楽を選択できる。このため、音声関連情報の内容に適した音楽を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【0015】
(11)上記課題を解決する音源形成方法は、音楽と関連ワードとが関係付けられている関係データにおける前記関連ワードと、音声関連情報のワードと、を照合するワード照合工程と、前記ワード照合工程の照合によって一致した一致ワードと前記関係データとに基づいて、前記一致ワードに関連する音楽を選択音楽として選択する音楽選択工程と、前記音声関連情報に係る音声データと前記選択音楽とを合成することによって音源を形成する合成工程と、を含む。この構成によれば、ワード照合工程は、関係データにおける関連ワードと音声関連情報のワードとを照合する。そして、音楽選択工程は、照合によって得られる一致ワードに関連する音楽を選択する。このように、音声関連情報から一致ワードに関連する音楽を選択できる。このため、音声関連情報の内容に適した音楽を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【発明の効果】
【0016】
本開示の音源形成システム、音源形成プログラム、および音源形成方法は、音楽を含む音源を形成する際に要する時間を短縮できる。
【図面の簡単な説明】
【0017】
【
図1】音源形成システムとサーバーとの関係を示す模式図である。
【
図2】第1実施形態における音源形成システムの構成を示すブロック図である。
【
図3】第1実施形態について、主テーブルの図である。
【
図4】第1実施形態について、第1テーブルの図である。
【
図5】第1実施形態について、第2テーブルの図である。
【
図6】第1実施形態における音声関連情報の一例を示す図である。
【
図7】第1実施形態における優先度データを示す図である。
【
図8】第1実施形態における音楽選択部を説明する図である。
【
図9】第1実施形態における、音源の構造を示す図である。
【
図10】第1変形例について、音源の構造を示す図である。
【
図11】第2変形例について、音源の構造を示す図である。
【
図12】第4変形例について、第3テーブルの図である。
【
図13】第4変形例について、第4テーブルの図である。
【
図14】第5変形例について、ワードを照合する範囲を示す図である。
【発明を実施するための形態】
【0018】
<第1実施形態>
図1~
図9を参照して、音源形成システム1について説明する。音源形成システムは、音源を形成する。音源は、放送装置、または音声再生装置によって再生される音データである。音源は、伝達事項と、音楽120とを含む。音源は、音源の開始部分に挿入されるイントロを含んでもよい。音源は、音源の開始部分に挿入されるアウトロを含んでもよい。伝達事項の例として、あいさつ、宣伝、掛け声、案内、注意喚起の言葉、等が挙げられる。
【0019】
音源の一例は、放送装置によって放送されるアナウンスである。アナウンスの一例では、イントロと、伝達事項と、伝達事項のBGMとして使われる音楽120と、アウトロとを含む。アナウンスは、公衆または来客向けの伝達事項である。
【0020】
音源の他の例は、音響装置によって再生される再生データである。音響装置の例として、CDプレーヤ、およびMP3プレーヤが挙げられる。再生データは、伝達事項と、伝達事項の前後に配置される音楽120とを含む。伝達事項として、例えば、客を呼び込む掛け声、近くの住人に販売車が近くにいることを知らせる宣伝、道路において注意を喚起する注意喚起の言葉、が挙げられる。掛け声の一例は、「いらっしゃい、いらっしゃい」である。宣伝の一例は、「いしやーきいも」である。注意喚起の言葉の一例は、「落石に注意してください。」である。アナウンスは、例えば、施設において放送される。施設の例として、スーパーマーケット、商店街、専門店、デパート、学校、病院、駅、および空港が挙げられる。
【0021】
音源形成システム1は、音声関連情報50に基づいて音源を形成する。音声関連情報50は、アナウンス文字情報50A、アナウンス音声情報、および音声情報を含む。音声関連情報50は、日本語以外の言語によって表される情報でもよい。日本語以外の言語として、中国語、韓国語、および英語が挙げられる。
【0022】
音声関連情報50は、音源を形成するための伝達事項を含む。音源としてアナウンスを形成する場合、音声関連情報50は、アナウンスに含まれる伝達事項である。例えば、デパートのアナウンスの場合、伝達事項は、「ようこそご来店くださいましてありがとうございます。本日は、婦人服売り場にて、年末セールを実施しております。」といった来店客に対するメッセージである。この例では、音源形成システム1は、音声関連情報50として、このようなメッセージに基づいて、音源としてのアナウンスを形成する。
【0023】
音声関連情報50は、文字データであってもよく、音データであってもよい。アナウンス文字情報50Aは、アナウンスに含まれる伝達事項を文字で表された文字データである。アナウンス音声情報は、アナウンスに含まれる伝達事項を音声で表された音声データである。アナウンス音声情報の具体例は、人の声が録音されたMP3形式のデータである。音声情報は、アナウンス以外の伝達事項を音声で表された音声データである。
【0024】
図1に示されるように、音源形成システム1は、ネットワーク2を介してサーバー3と接続する。サーバー3は、音源の形成のために利用される複数の音楽120(
図8参照)を格納する。ネットワークの例として、インターネット、ローカルネットワーク、および、電話回線が挙げられる。
【0025】
図2に示されるように、音源形成システム1は、ワード照合部10と、キーワード選択部20と、音楽選択部30と、合成部40と、を備える。音源形成システム1は、さらに、入力部4と、出力部5と、を備えてもよい。
【0026】
音源形成システム1は、音源形成のための音声関連情報50を予め有してもよい。一例では、音源形成システム1は、音声関連情報50のライブラリを有する。この場合、音源形成システム1は、音声関連情報50のライブラリを記憶するための記憶部を備える。音源形成システム1は、音声関連情報50を外部から取得してもよい。この場合、音源形成システム1は、入力部4を備える。
【0027】
入力部4は、音源の作成のための音声関連情報50を取得する。入力部4は、音声関連情報50を記憶する記憶部に接続するように構成され、かつ、記憶部から音声関連情報50を取得する。記憶部として、ハードディスク、半導体メモリ、インターネットに繋がるサーバー3等が挙げられる。記憶部は、音源形成システム1外に設けられてクラウド上の装置として構成されてもよいし、音源形成システム1内に設けられてもよい。出力部5は、合成部40によって形成された音源を外部に出力する。出力部5の例として、表示装置、および、音再生装置が挙げられる。
【0028】
<関係データ>
関係データ60は、音楽選択部30において使用されるデータである。関係データ60は、音楽120と関連ワード125とが関係付けられているデータである。関係データ60において、関連ワード125と関係付けられる音楽120は、BGM等の音楽を含む。関係データ60において、関連ワード125と関係付けられる音楽120は、自然の音、チャイム等の効果音、等を含んでもよい。関係データ60は、音楽120の音楽データと関連ワード125とが関係付けられているデータであってもよい。関係データ60は、音楽120の固有番号とワードとが関係付けられているデータであってもよい。後者の場合、固有番号と、固有番号に対応する音楽120とが関係付けられる。そして、音楽120は、音源形成システム1とは別のサーバー3に管理される。本実施形態では、関係データ60は、音楽120の固有番号と関連ワード125とが関係付けられているデータである。
【0029】
本実施形態では、関係データ60は、テーブル130である。テーブル130は、関連ワード125を有する。関連ワード125は、音楽120と関係付けられるワードである。テーブル130は、関連ワード125のそれぞれに音楽120が紐づけられているデータである。一例では、テーブル130において、関連ワード125に関連する音楽120の固有番号と、当該関連ワード125とが紐づけられている。
【0030】
例えば、関連ワード125は、施設名111に関連するワードによって構成されてもよい。また、関連ワード125は、ジャンルに関連するワードによって構成されてもよい。また、関連ワード125は、特定のワードから連想されるワードによって構成されてもよい。
【0031】
関連ワード125は、音楽120の特徴、音楽120の用途、音楽120の使用季節、等を示す。音楽120の特徴として、テンポ、ジャンル、人の抱くイメージ、等の情報が挙げられる。音楽120の用途として、イベント等の情報が挙げられる。イベントとして、セール、運動会、等が挙げられる。
【0032】
図3~
図5を参照して、テーブル130の一例の説明をする。
テーブル130は、主テーブル130Aを含む。さらに、テーブル130は、第1テーブル131と、第2テーブル132とを含んでもよい。
【0033】
図3を参照して、主テーブル130Aを説明する。
図3に示されるように、主テーブル130Aは、予め選ばれた関連ワード125と音楽120との関係を示す。関連ワード125は、多種多様な伝達事項から予め選ばれる。例えば、伝達事項の内容を特徴づけるワードが関連ワード125に選ばれる。
【0034】
図4を参照して、第1テーブル131の説明をする。
図4に示されるように、第1テーブル131は、施設名111と音楽120との関係を示す。施設名111は、関連ワード125に含まれる。
図4に示される第1テーブル131の例では、結婚式場は、第1音楽31と第4音楽34とに紐づけられる。専門店は、第1音楽31と第2音楽32と第3音楽33とに紐づけられる。スーパーマーケットは、第2音楽32と第3音楽33と第4音楽34とに紐づけられる。すなわち、第1音楽31は、結婚式場と専門店とに紐づけられる。第2音楽32は、専門店とスーパーマーケットとに紐づけられる。第3音楽33は、専門店とスーパーマーケットとに紐づけられる。第4音楽34は、結婚式場とスーパーマーケットとに紐づけられる。第1テーブル131によれば、音楽120を使用する施設の指定によって、音楽120を選択できる。
【0035】
図5を参照して、第2テーブル132の説明をする。
図5に示されるように、第2テーブル132は、関連ワード125と、関連ワード125に紐づけられる音楽120の固有番号との関係を示す。この例では、施設名111は、関連ワード125に含まれる。第2テーブル132における関連ワード125は、主に、音楽120の特徴を示す情報が含まれる。
【0036】
音源形成者または音源形成システム1の運営者は、予め音楽120に関する情報を音源形成システム1に登録する。音源形成者は、登録画面から音楽120に関する情報を登録できる。一例では、音楽120の固有番号は、音源形成システム1の記憶部に記憶される。固有番号に対応付けられる音楽データは、音楽データの固有番号と紐づけられた状態でサーバー3に記憶される。
【0037】
<ワード照合部>
図6に示されるように、ワード照合部10は、関連ワード125と音声関連情報50のワードとを照合する。本実施形態において、ワード照合部10は、テーブル130の関連ワード125を1つずつ音声関連情報50のワードと照合する。例えば、ワード照合部10は、主テーブル130Aの関連ワード125を1つずつ音声関連情報50のワードと照合する。ワード照合部10による照合によって関連ワード125と一致したワードを「一致ワード6」と言う。
【0038】
図6を参照して、一致ワード6について説明する。
図6には、アナウンス文字情報50Aの一例が示されるとともに、ワード照合部10の照合によって一致した一致ワード6が示される。一致ワード6は、
図6において「6」として示されている。この例では、ご案内、レストラン、フードコート、カフェ、ポイント、8月、期間限定、お得、および専門店、が一致ワード6である。
【0039】
音声関連情報50が音声データである場合、ワード照合部10は、音声関連情報50を文字情報に変換した後、テーブル130に基づいて関連ワード125と文字情報に変換された音声関連情報50のワードとの照合を開始する。
【0040】
<キーワード選択部>
キーワード選択部20は、一致ワード6からキーワード21を選択する。このとき、キーワード選択部20は、優先度データ22を参照することによって一致ワード6からキーワード21を選択してもよい。優先度データ22は、一致ワード6の優先度を設定するための基準データである。キーワード選択部20は、一致ワード6をすべてキーワード21に選択してもよいし、一致ワード6の幾つかを選択をしてもよい。また、キーワード選択部20は、一致ワード6からキーワード21を選択しなくてもよい。
【0041】
図7に優先度データ22の一例を示す。優先度データ22は、複数の登録ワード110を含む。優先度データ22において、複数の登録ワード110それぞれには、キーワード21として選択される優位性を示す優先度が付与される。優先度は数値で表され、その数値によってキーワード選択部20は優先度を判定する。
【0042】
優先度データ22における登録ワード110は、音源形成システム1が参照する記憶部に予め登録される。記憶部は、音源形成システム1外に設けられてクラウド上の装置として構成されてもよいし、音源形成システム1内に設けられてもよい。登録ワード110は、辞書または日常で使われる言葉から任意に選択される。具体的には、アナウンスに頻度高く登場する単語が登録ワード110として登録される。
【0043】
優先度は、登録ワード110毎に設定される。優先度は、上述のように、キーワード21として選択される優位性と定義される。「キーワード21として選択される優位性」があるキーワード21は、音楽120と関係性の高いワードである。音楽120と関係性の高いワードが音声関連情報50の伝達事項の内容に含まれる場合、音声関連情報50と実質的にマッチする音楽120が選択される可能性が高い。例えば、
図6の例では、お客様、電子マネー、専用カード、などのワードは、所定の特徴の音楽120を想像させるような言葉ではないため、これらのワードは、音楽120と関係性の低いワードである。これに対して、レストラン、カフェ、8月、などは、所定の特徴の音楽120を想像させるワードである。例えば、レストランであれば明るい曲が想像される。カフェであれば、落ち着いた曲が想像される。8月であれば、夏の曲が想像される。このため、これらのワードは音楽120と関係性の高いワードである。
【0044】
図6に示される例では、キーワード21は「21」として示されている。この例では、キーワード選択部20の動作によって、レストラン、カフェ、ポイント、8月、期間限定、お得、がキーワード21として設定される。
【0045】
<音楽選択部>
図8および
図9を参照して、音楽選択部30を説明する。
【0046】
図8に示されるように、音楽選択部30は、ネットワーク2を介して複数の音楽120から選択音楽121を選択する。具体的には、一致ワード6と、関係データ60とに基づいて、一致ワード6に関連する音楽120を選択音楽121として選択する。上述のように、関係データ60は、音楽120とワードとが関係付けられているデータである。音楽選択部30は、1つの選択音楽121を選択してもよいし、複数の選択音楽121を選択してもよいし、選択音楽121を選択しなくてもよい。
【0047】
音楽選択部30によって複数の選択音楽121が選択された場合、音源形成者は、選択音楽121それぞれを試聴することができる。音源形成者は、選ばれた複数の選択音楽121の中から音声データ122(
図9参照)と合成する選択音楽121Aを採用してもよい。また、音源形成者は、音声データ122と合成する選択音楽121Aを採用しなくてもよい。音楽120から選択音楽121が選択されない場合、音源形成者は、選択音楽121を除き、音声データ122およびチャイム123(後述)を合成して音源を形成してもよい。
【0048】
一致ワード6は、関係データ60から音声関連情報50に関連する音楽120を選択するための情報である。一致ワード6は、音声関連情報50に含まれるワードであるため、音楽選択部30は、一致ワード6と関係データ60とによって、音声関連情報50に関連する音楽120を選択できる。
【0049】
一致ワード6には、様々なワードが含まれる。一致ワード6には、音声関連情報50の伝達事項の内容に関連する音楽120を選択する場合においてノイズとなるワードも含まれる場合がある。
【0050】
上述のように、一致ワード6の中から選択されるキーワード21は、音楽120と関係性の高いワードである。キーワード21を使うことによって、音声関連情報50に適した音楽120を選択できる。
【0051】
音声関連情報50から複数のキーワード21が選択される場合において、これらキーワード21を使うことによって選択される複数の音楽120が1つのカテゴリに集約しない場合がある。例えば、音声関連情報50に「クリスマス」というキーワード21を含む場合、音声関連情報50によって、クリスマスに関連して、クラシックの音楽と、ロックの音楽と、歌謡曲の音楽と、民族音楽とが同時に選択される場合がある。そこで、選択される複数の音楽120の数を絞るため、または、音声関連情報50に適した音楽120を選択するために、キーワード21に加えて追加情報が使用されてもよい。
【0052】
追加情報が使われることによって、音声関連情報50に適した音楽120の数を絞ることができる。このため、一例では、音楽選択部30は、キーワード21および追加情報と、関係データ60とに基づいて、キーワード21および追加情報に関連する音楽120を選択音楽121として選択する。
【0053】
本実施形態において、音楽選択部30は、音楽120の選択において、一致ワード6のうちのキーワード21を参照とともに、さらに、追加情報を参照してもよい。具体的には、音楽選択部30は、キーワード21および追加情報と、関係データ60とに基づいて、キーワード21と追加情報とに関連する音楽120を選択音楽121として選択する。キーワード21および追加情報は、関係データ60から音楽120を選択するための情報である。
【0054】
<追加情報>
追加情報は、音源使用時の予想天気、音源使用時の季節、音源使用の日に関する情報、音源使用時の場所、音源使用の場所にいる人の視覚的情報、音源使用時の時刻、音源使用の目的、音源使用の場所の音環境、音源使用の店舗のスタイル、音源使用の理念、音源使用する人または団体の施設、音源を聞きうる人の個人情報、および、任意に設定可能な追加キーワードの少なくとも1つである。以下、これらの項目を追加情報の項目という。
【0055】
追加情報の登録方法には、音源形成システム1の検索時に入力画面を介してキーボードによって音楽選択部30に入力して登録する方法、音源形成システム1の検索前にあらかじめ登録画面に入力して登録する方法、および外部API(Application Programming Interface)によってリアルタイムに登録する方法が挙げられる。本実施形態の追加情報の登録方法は、入力画面を介してキーボードによって音楽選択部30に入力して登録する方法である。入力画面には、追加情報の項目が表示される。追加情報は、追加情報の項目とともに項目に関する情報を含む。追加情報は音楽選択部30に入力される。追加情報の一例は、項目としての「音源使用時の予想天気」と、項目に関する情報としての「晴」とを含む。
【0056】
音源使用時の予想天気は、音源が使用されるときの予想天気を示す。例えば、梅雨時に音源を使用する場合は、予想天気は雨である。
音源使用時の季節は、音源が使用される季節を示す。例えば、音源使用者が春に音源を使用する予定である場合、追加情報として春が音楽選択部30に入力される。
【0057】
音源使用の日に関する情報の例として、記念日、祝日、過去の災害発生日、等が挙げられる。
音源使用時の場所は、音源が使用される場所を示す。例えば、音源使用者が駅で音源を使用する予定である場合、追加情報として駅が音楽選択部30に入力される。
【0058】
音源使用の場所にいる人の視覚的情報は、音源が使用される場所にいる人の視覚的情報を示す。人の視覚的情報には、人数情報、世代情報、属性情報、および、流行情報が含まれる。人の視覚的情報は、音源使用時の場所において想定される情報であってもよい。この人の視覚的情報は、音源使用時の場所に設置されるカメラによって撮影される撮影情報に基づいて設定されてもよい。
【0059】
人数情報は、音源が使用される場所にいる人の人数情報を示す。音源の作成が、音源の使用と並行して実行される場合、撮影情報に基づいてカウントされる人数情報が音楽選択部30に入力されてもよい。例えば、店舗に設置されるカメラによって人数情報がカウントされる場合がある。この場合、人数情報が音楽120選択の追加情報として使われることによって、来店人数に基づいて音源を変更できる。
【0060】
世代情報は、音源が使用される場所にいる人の世代情報を示す。音源の作成が、音源の使用と並行して実行される場合、撮影情報に基づいて判定される世代情報が音楽選択部30に入力されてもよい。例えば、スーパーに設置されるカメラによって映った人の年齢層を分析し、マーケティングに活用する場合がある。この場合、世代情報が音楽120選択の追加情報として使われることによって、来店する人の世代に基づいて音源を変更できる。
【0061】
属性情報は、音源が使用される場所にいる人の属性情報を示す。人の属性情報は、音源が使用される場所にいる人に備わる固有の特徴のことである。例えば、ビジネススーツを着た人の属性は、ビジネスマンである。
【0062】
流行情報は、音源が使用される場所にいる人の流行情報を示す。流行情報は、音源が使用される場所にいる人がどの流行に影響されているかを示す情報である。流行情報は、例えば、世間のニュースを参照して、その人の服装、携帯される用具、装着される装飾品、等から判断される。
【0063】
音源使用時の時刻は、音源が使用される予定の時刻を示す。
音源使用の目的の例として、例えば、注意喚起、宣伝、告知、等が挙げられる。
音源使用の場所の音環境は、音源が使用される場所における音の人への伝わり易さを示す。例えば、音源が使用される場所が工事現場である場合、騒音が大きくことからアナウンスが人に伝わり難いため、音環境は悪環境である。音源が使用される場所がオフィスである場合、騒音が少ないことからアナウンスが人に伝わり易いため、音環境は良環境である。
【0064】
音源使用の店舗のスタイルの例として、例えば、若者向け、フォーマル、飲食系、販売系、立ち食い、無人店舗、等が挙げられる。
音源使用の理念は、音源使用について音源使用者がもつ理念を示す。音源使用の理念の例として、例えば、元気な感じ、清涼な感じ、落ち着く感じ、等が挙げられる。
【0065】
音源使用する人または団体の施設の例として、スーパー、オフィス、工場、病院、学校、等が挙げられる。
音源を聞きうる人の個人情報の例として、性別、年齢、職業、所属、属性等が挙げられる。
【0066】
<音楽選択部の動作>
上述のとおり、音楽選択部30は、一致ワード6と関係データ60とに基づいて、一致ワード6に関連する音楽120を選択音楽121として選択する。
【0067】
他の例では、音楽選択部30は、キーワード21と関係データ60とに基づいて、キーワード21に関連する音楽120を選択音楽121として選択する。
【0068】
音楽選択部30は、キーワード21および追加情報と、関係データ60とに基づいて、キーワード21と追加情報とに関連する音楽120を選択音楽121として選択してもよい。
【0069】
キーワード21は、テーブル130に基づく照合によって一致した一致ワード6の中から選択されたワードである。追加情報は、関係データ60から音楽120を選択する場合に、キーワード21とともに参照される情報である。追加情報は、音源形成者によって設定される情報である。
【0070】
音楽選択部30の動作の一例として、キーワード21および追加情報とを使う場合を説明する。以下の例は、一致ワード6の中からキーワード21として「ポイント」が選択されている場合の例である。
【0071】
第1ステップにおいて、音楽選択部30は、追加情報として音源使用時の場所が設定されている場合、第1テーブル131または第2テーブル132を参照する。本実施形態では第1テーブル131を参照する。例えば、音源使用時の場所が「結婚式場」である場合、音楽選択部30は、第1テーブル131または第2テーブル132を参照して、結婚式場に紐づけられる音楽120を選択する。
図4に示される第1テーブル131の場合、第1音楽31と第4音楽34とが選択される。
【0072】
第2ステップにおいて、音楽選択部30は、第2テーブル132を参照し、キーワード21に紐づけられている音楽120を選択する。例えば、キーワード21が「ポイント」である場合、音楽選択部30は、ポイントに紐づけられる音楽120を選択する。
図5に示される第2テーブル132の場合、第1音楽31と第3音楽33とが選択される。
【0073】
音楽選択部30は、第1ステップおよび第2ステップの両ステップにおいて選択されている音楽120を、候補の選択音楽121として選択する。この例では、音楽選択部30は、第1音楽31、第3音楽33、および第4音楽34を候補の選択音楽121として選択する。そして、音源形成者は、選択された選択音楽121の中から1つを音声データ122と合成する選択音楽121Aとして採用する。この例では、第1音楽31を採用する。音楽選択部30は、最終候補の選択音楽121Aを合成部40に出力する。音楽選択部30は、さらに、最終候補の選択音楽121Aを出力部5に出力してもよい。
【0074】
以上の音楽120の選択方法は一例である。音楽選択部30は、キーワード21および追加情報の情報をすべて含む音楽120のみを選択してもよいし、キーワード21および追加情報のうち少なくとも1つの情報を含む音楽120を選択してもよい。
【0075】
<合成部>
合成部40は、音声関連情報50に係る音声データ122と選択音楽121とを合成する。合成部40は、音声関連情報50に係る音声データ122と選択音楽121とチャイム123とを合成してもよい。チャイム123は、音源形成者によって予め設定される。チャイム123は、音声関連情報50に基づいて、上述のワード照合部10とキーワード選択部20と音楽選択部30との機能によって選択されてもよい。
【0076】
音声関連情報50に係る音声データ122は、予め用意されているデータであってもよいし、文字情報(例えば、アナウンス文字情報50A)から音声合成ソフトによって形成されるデータであってもよい。
【0077】
図9に示されるように、音源は、イントロ部と、中間部と、アウトロ部とを備える。イントロ部とアウトロ部には、チャイム123が挿入される。中間部には、音声関連情報50に係る音声データ122と、音源形成者によって採用された選択音楽121Aとが挿入される。選択音楽121Aは、BGMとして音声データ122に重ね合わされる。一例では、選択音楽121Aのデータ時間長は、音声データ122のデータ時間長よりも長い。また、選択音楽121Aのデータ時間長は、音声データ122のデータ時間長よりも短くてもよい。この場合、選択音楽121Aは音声データ122のデータ時間長よりも長い時間、繰り返し再生されるように合成部40によって合成されてもよい。
【0078】
合成部40は、音声データ122、チャイム123、選択音楽121A、および音源を調整する。調整には、音量調整、ノイズ処理、曲調の変更、テンポの変更、データ時間長の変更、および無音カット処理が含まれる。調整は、自動に行われてもよいし、手動で行われてもよい。
【0079】
音量調整には、ラウドネス平均値の調整、トゥルーピークの調整、およびゲイン調整が含まれる。
【0080】
ノイズ処理とは、音声データ122、チャイム123、選択音楽121A、および音源において、ノイズを除去する処理である。ノイズには、リップノイズ、ホワイトノイズ、およびポップノイズが含まれる。
【0081】
曲調、テンポ、およびデータ時間長の変更は、チャイム123、選択音楽121A、および音源のデータを編集することによって変更できる。
【0082】
無音カット処理は、音声データ122、チャイム123、選択音楽121A、および音源において、データの無音部分をカットする処理である。
【0083】
調整は、音声データ122、チャイム123、および選択音楽121Aの合成前に行われてもよい。調整は、音声データ122、チャイム123、および選択音楽121Aの合成中に行われてもよい。
【0084】
音源は次のように構成されてもよい。音源の前部は、チャイム123から始まり、選択音楽121Aがフェードインするように構成される。音源の中間部は、選択音楽121Aがしばらく流れた後、選択音楽121Aの音量が徐々に下がるように構成される。音源の中間部の後部は、所定の音量の大きさまで選択音楽121Aの音量が下げられた後、選択音楽121Aの音量は維持され、音声データ122の再生終了後、選択音楽121Aが当初の音量の大きさまで徐々に戻るように構成される。音源の後部は、選択音楽121Aがしばらく流れた後、選択音楽121Aがフェードアウトし、その後、チャイム123が鳴るように構成される。
【0085】
出力部5(
図2参照)は、合成部40によって合成された音源を出力する。出力するファイル形式には、AIFF、AAC、FLAC、WAV、およびMP3が挙げられる。本実施形態において、音源のファイル形式はWAVである。
【0086】
<音源形成プログラム>
音源形成プログラムは、コンピュータに音源を形成させる。
音源形成プログラムは、ワード照合ステップと、音楽選択ステップと、合成ステップとを含む。
【0087】
ワード照合ステップは、コンピュータに、関連ワード125と音声関連情報50のワードとを照合させる。一例では、音声関連情報50は、入力部4が取得する情報である。
【0088】
音楽選択ステップは、コンピュータに、ワード照合ステップの照合によって一致した一致ワード6と関係データ60とに基づいて、一致ワード6に関連する音楽120を選択音楽121として選択させる。
【0089】
合成ステップは、コンピュータに、音声関連情報50に係る音声データ122に選択音楽121を合成させる。音楽選択ステップにおいて複数の選択音楽121が選択される場合は、合成する選択音楽121Aを音源形成者が採用してもよい。合成された音源は、出力部5によって出力される。
【0090】
<音源形成方法>
音源形成方法は、音源を形成する音源形成方法である。音源形成方法は、ワード照合工程と、音楽選択工程と、合成工程とを含む。
【0091】
ワード照合工程は、関連ワード125と音声関連情報50のワードとを照合する。
【0092】
音楽選択工程は、ワード照合工程の照合によって一致した一致ワード6と関係データ60とに基づいて、一致ワード6に関連する音楽120を選択音楽121として選択する。
【0093】
合成工程は、音声関連情報50に係る音声データ122に選択音楽121を合成する。音楽選択工程において複数の選択音楽121が選択される場合は、合成する選択音楽121Aを音源形成者が採用してもよい。
【0094】
本実施形態の作用を説明する。
アナウンスなど言葉を含む音声に音楽を付けることがある。例えば、店舗におけるアナウンスにはBGMが付けられる。また、アナウンスなど言葉を含む音声に敢えて音楽を付けないこともある。例えば、電車に流れるアナウンスにBGMを付ける必要のない場合がある。音源形成者は、アナウンスの内容からアナウンスに適切な音楽を選択する必要がある。また、音源形成者は、アナウンスの内容からアナウンスに音楽を付与しないことを判断する必要がある。しかし、音源形成者は、必ずしも、アナウンスが使われる状況を把握しているわけではない。音源形成者は、アナウンスの提供者にどういう状況でアナウンスが使用されているかを確認したり、アナウンスの内容から使われる状況を推察したりする必要がある。このような事項を確認する必要性があることから、音源形成者は、アナウンスに適切な音楽を選択することに多大な時間をかけている。音楽のデータベースがある場合でも、音源形成者は、アナウンスにあう音楽を音楽のデータベースから選択することは、時間を要する作業となっている。
【0095】
この点、音楽選択部30は、アナウンスなどの音声関連情報50と、関係データ60とに基づいて、音声関連情報50に関連する音楽120を選択音楽121として選択できる。音楽選択部30は、音声関連情報50に関連する音楽120がある場合、その音楽120を選択音楽121として選択できる。また、音楽選択部30は、音声関連情報50に関連する音楽120がない場合、選択音楽121を選択しないようにすることもできる。このため、音源形成システム1が選択音楽121を出力する場合には、音源形成者は、音声関連情報50に関連する適切な音楽120を選択できる。また、音源形成システム1が選択音楽121を出力しない場合には、音源形成者は、音声関連情報50に関連する適切な音楽120が見つからない、または、音声関連情報50には音楽を付ける必要がない、と理解できる。このように、音楽選択部30によれば、音声関連情報50に適した音楽を選択するだけでなく、音声関連情報50に適した音楽の存否を提供できる。音源形成者は、選択された音楽、および、音声関連情報50に適した音楽の存否を得ることができるため、その内容に基づいて、音声関連情報50に付ける音楽を選択したり、音声関連情報50に敢えて音楽を付けない判断を行ったりすることが容易になる。この結果、音源作成にかかる一連の作業時間を短縮できる。そして、合成部40は、音楽選択部30によって選択された選択音楽121を音声データ122と自動に合成する。これによって、音源を形成する時間を短縮できる。
【0096】
本実施形態の効果を説明する。
(1)音源形成システム1は、ワードを含む音声関連情報50と、音楽120と関連ワード125とが関係付けられている関係データ60とに基づいて、音声関連情報50に関連する音楽120を選択音楽121として選択する音楽選択部30と、を備える。そして、音源形成システム1は、音声関連情報50に係る音声データ122と選択音楽121とを合成することによって音源を形成する合成部40を備える。この構成によれば、ワードを含む音声関連情報50と、音楽120と関連ワード125とが関係付けられている関係データ60とに基づいて、音声関連情報50に関連する音楽120を選択できる。このため、音声関連情報50の内容に適した音楽120を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【0097】
(2)音源形成システム1は、関係データ60における関連ワード125と音声関連情報50のワードとを照合するワード照合部10をさらに備える。音楽選択部30は、ワード照合部10による照合によって関連ワード125と一致した一致ワード6と関係データ60とに基づいて、一致ワード6に関連する音楽120を選択音楽121として選択する。この構成によれば、ワード照合部10は、関係データ60における関連ワード125と音声関連情報50のワードとを照合する。そして、音楽選択部30は、照合の結果得られる一致ワード6に関連する音楽120を関係データ60から選択する。このように、関係データ60から音声関連情報50に関連する音楽120を選択できる。このため、音声関連情報50の内容に適した音楽120を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【0098】
(3)音源形成システム1は、一致ワード6からキーワード21を選択するキーワード選択部20をさらに備える。音楽選択部30は、キーワード21と関係データ60とに基づいて、キーワード21に関連する音楽120を選択する。この構成によれば、キーワード21に基づいて音楽120を選択できる。これにより、音楽選択部30は、音声関連情報50の内容に適した音楽120を選択し易い。
【0099】
(4)音源形成システム1において、優先度データ22を有する。優先度データ22は、複数の登録ワード110を含む。複数の登録ワード110それぞれには、キーワード21として選択される優位性を示す優先度が付与されている。キーワード選択部20は、優先度データ22を参照することによって一致ワード6からキーワード21を選択する。この構成によれば、優位性の高いキーワード21に基づいて音楽120を選択できる。このため、音楽選択部30は、音声関連情報50の内容に適した音楽120を効率的に選択できる。
【0100】
(5)音楽選択部30は、一致ワード6および追加情報と、関係データ60とに基づいて、一致ワード6および追加情報に関連する音楽120を選択音楽121として選択する。この構成によれば、音声関連情報50および追加情報に基づいて音楽120を選択できる。このため、音楽選択部30は、音楽120をさらに効率的に選択できる。
【0101】
(6)追加情報は、音源使用時の予想天気、音源使用時の季節、音源使用の日に関する情報、音源使用時の場所、音源使用の場所にいる人の視覚的情報、音源使用時の時刻、音源使用の目的、音源使用の場所の音環境、音源使用の店舗のスタイル、音源使用の理念、音源使用する人または団体の施設、音源を聞きうる人の個人情報、および、任意に設定可能な追加キーワードの少なくとも1つである。この構成によれば、音声関連情報50だけでなく、これらの情報に基づいて音楽120を選択できる。
【0102】
(7)関係データ60は、テーブル130である。テーブル130は、複数の音楽120のそれぞれに関連ワード125が紐づけられているデータである。この構成によれば、テーブル130に基づいて音楽120を選択できる。
【0103】
(8)音声関連情報50は、アナウンス文字情報50A、アナウンス音声情報、および音声情報の少なくとも1つを含む。この構成によれば、アナウンス文字情報50A、アナウンス音声情報、および音声情報の少なくとも1つを含む音声関連情報50について、音声関連情報50に適した音楽120を選択できる。
【0104】
(9)音源形成プログラムは、音楽120と関連ワード125とが関係付けられている関係データ60における関連ワード125と、音声関連情報50のワードと、を照合するワード照合ステップと、音楽選択ステップと、音声関連情報50に係る音声データ122に選択音楽121を合成することによって音源を形成させる合成ステップと、を含む。音源形成プログラムは、これらステップをコンピュータに実行させる。音楽選択ステップでは、コンピュータは、ワード照合ステップの照合によって一致した一致ワード6と関係データ60とに基づいて、一致ワード6に関連する音楽120を選択音楽121として選択する。この構成によれば、ワード照合ステップは、関係データ60における関連ワード125と音声関連情報50のワードとを照合する。そして、音楽選択ステップは、照合によって得られる一致ワード6に関連する音楽120を選択できる。このように、音声関連情報50の内容に適した音楽120を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【0105】
(10)音源形成方法は、音楽120と関連ワード125とが関係付けられている関係データ60における関連ワード125と、音声関連情報50のワードと、を照合するワード照合工程と、音楽選択工程と、音声関連情報50に係る音声データ122と選択音楽121とを合成することによって音源を形成する合成工程と、を含む。音楽選択工程では、ワード照合工程の照合によって一致した一致ワード6と関係データ60とに基づいて、一致ワード6に関連する音楽120を選択音楽121として選択する。この構成によれば、ワード照合工程は、関係データ60における関連ワード125と音声関連情報50のワードとを照合する。そして、音楽選択工程は、照合によって得られる一致ワード6に関連する音楽120を選択できる。このように、音声関連情報50の内容に適した音楽120を選択する作業を軽減できる。これによって、音源を形成する時間を短縮できる。
【0106】
<第2実施形態>
第2実施形態の音源形成システム1を説明する。本実施形態において、第1実施形態と共通する構成については、第1実施形態の構成と同一の符号を付し、重複する構成についてはその説明を省略する。
【0107】
本実施形態の関係データ60は、次の点で、第1実施形態の関係データ60と相違する。第1実施形態では、関係データ60は、テーブル130である。これに対して、本実施形態では、関係データ60は、学習済データである。学習済みモデルは、ニューラルネットワークを使った深層学習によって形成される。
【0108】
学習済データは、予め互いに紐づけられた音楽120と関連ワード125とのデータセットに基づく学習によって得られたデータである。一例として、学習済データは、互いに紐づけられた音楽120と関連ワード125とのデータセットをディープラーニングによって学習した学習済みモデルによって構成される。学習済データは、複数の関連ワード125と複数の音楽120とがニューラルネットワークを介して関係付けられている。音楽選択部30は、複数の一致ワード6を学習済データに入力することによって、複数の一致ワード6を含む概念に最も関連した音楽120を選択する。これにより、音楽選択部30は、選択に要する時間を短縮し易い。また、キーワード21の選択が不要になるため、キーワード21の選択によって生じる可能性がある音楽120の選択漏れを少なくできる。
【0109】
<変形例>
上記各実施形態は、音源形成システム1、音源形成プログラム、および音源形成方法が取り得る形態の例示であり、その形態を制限することを意図していない。音源形成システム1、音源形成プログラム、および音源形成方法は、上記各実施形態に例示された形態とは異なる形態を取り得る。その一例は、実施形態の構成の一部を置換、変更、もしくは、省略した形態、または、実施形態に新たな構成を付加した形態である。以下に実施形態の変形例の一例を示す。
【0110】
<第1変形例>
・
図10に示されるように、音源は、次のように構成されてもよい。音源の全部は、チャイム123から始まり、選択音楽121Aがフェードインするように構成される。音源の中間部は、選択音楽121Aがしばらく流れた後、選択音楽121Aの音量が徐々に下がるように構成される。音源の中間部の後部は、所定の音量の大きさまで選択音楽121Aの音量がさげられた後、選択音楽121Aの音量は維持され、第1音声データ200が再生される。第1音声データ200の再生終了後、少しして第2音声データ201が再生される。第2音声データ201の再生終了後、選択音楽121Aが当初の音量の大きさまで徐々に戻るように構成される。
【0111】
第1音声データ200は第2音声データ201と同じデータであってもよいし、異なるデータであってもよい。
【0112】
<第2変形例>
・
図11に示されるように、音源は、第1音源300および第2音源301を合成することによって構成されてもよい。第1音源300は第2音源301と同じデータであってもよいし、異なるデータであってもよい。
【0113】
<第3変形例>
・
図12および
図13を参照して、第4変形例のテーブル130を説明する。本変形例のテーブル130は、組み合わせテーブルを含む。組み合わせテーブルは、第3テーブル133と第4テーブル134とによって構成される。
【0114】
図12に示されるように、第3テーブル133は、施設名111と、施設名111に関する情報との関係を示す。施設名111は、関連ワード125に含まれる。第3テーブル133において、各施設名111それぞれは、施設名111に関する情報と紐づけられる。
【0115】
図13に示されるように、第4テーブル134は、音楽120と、音楽120に関する情報との関係を示す。音楽120は、音楽120に関する情報と紐づけられる。第4テーブル134に示される音楽120は、第5音楽35、第6音楽36、第7音楽37、第8音楽38である。
【0116】
第3テーブル133によれば、各施設名111は、施設名111に関する情報と紐づけられている。具体的には、施設名111には、施設名111のスタイル、流す曲のジャンル、および現場の音環境などが紐づけられている。一方、第4テーブル134では、各音楽120は、音楽120に関する情報と紐づけられている。具体的には、音楽120は、ジャンル、雰囲気、およびテンポなどが紐づけられている。これにより、組み合わせテーブルは、間接的に音楽選択部30は、第3テーブル133と第4テーブル134とに基づくことによって、各施設名111にあう音楽120を選択できる。例えば、施設名111がイベント会場であれば、流す曲のジャンルはロックである。音楽選択部30は、第4テーブル134からイベント会場にあう音楽120を選択する。
【0117】
そして、音楽選択部30は、第3テーブル133と第4テーブル134とを参照して選択された音楽120の中から、キーワード21に紐づけられる音楽120を選択する。これによって、音声関連情報50に適した音楽120が選択される。
【0118】
<第4変形例>
・
図14を参照して、音声関連情報50においてワードを照合する範囲を設定する範囲設定部について説明する。
【0119】
図14を参照して、ワードを照合する範囲の一例を説明する。範囲設定部は、音声関連情報50においてワードを照合する範囲を設定する。この例では、音声関連情報50は、アナウンス文字情報50Aである。範囲設定部は、アナウンス文字情報50Aから「いらっしゃいませ。ご来店中のお客様にご案内申し上げます。」と「本日のご来店誠にありがとうございます。」とを除いた部分を、ワードを照合する範囲に設定する。除かれた部分は、定型部分である。ワード照合部10は、関係データ60に基づいて、音声関連情報50において範囲設定部によって設定された範囲において関連ワード125を照合し、その後、ワード照合部10の照合によって一致した関連ワード125を一致ワード6として出力する。
【0120】
このような範囲設定部によれば、アナウンス文字情報50Bからワードを照合する範囲を設定することができる。これにより、音源形成システム1は、一致ワード6を選択し終わるまでに要する時間を短縮できる。
【0121】
また、音声関連情報50がアナウンス音声情報および音声情報である場合、範囲設定部は、次のようにワードを照合する範囲を設定してもよい。範囲設定部は、アナウンス音声情報および音声情報における抑揚からワードを照合する範囲を設定する。一例として、範囲設定部は、アナウンス音声情報および音声情報において、音素が発せられる速さが他の箇所と比較して遅い箇所を含む部分を照合する範囲として設定する。これにより、ワード照合部10は、アナウンス音声情報および音声情報において重要な箇所およびその箇所を含む部分からワードを照合できる。
【0122】
<第5変形例>
・ワード照合部10は、音声関連情報50のワードに基づいて、音声関連情報50のワードと関連ワード125とを照合してもよい。音声関連情報50のワードは単語である。具体的には、ワード照合部10によって照合されるワードの種類は、名詞、数詞と助数詞とからなる単語、および、感動詞である。音声関連情報50がアナウンス文字情報50Aである場合、ワード照合部10は、形態素解析によって、アナウンス文字情報50Aから、名詞、数詞と助数詞とからなる単語、および、感動詞を関連ワード125と照合させる。音声関連情報50が音声データである場合、ワード照合部10は、音声関連情報50を文字情報に変換した後、形態素解析を実行する。
【符号の説明】
【0123】
1…音源形成システム、2…ネットワーク、3…サーバー、4…入力部、5…出力部、6…一致ワード、10…ワード照合部、20…キーワード選択部、21…キーワード、22…優先度データ、30…音楽選択部、40…合成部、50…音声関連情報、50A…アナウンス文字情報、50B…アナウンス文字情報、60…関係データ、110…登録ワード、111…施設名、120…音楽、121…選択音楽、122…音声データ、125…関連ワード、130…テーブル、131…第1テーブル、132…第2テーブル、133…第3テーブル、134…第4テーブル。