(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の技術では、課金処理の実行前に利用者に提供される音声データが低音質の音声データに制限され、課金処理の実行を条件として制限が解除される。しかし、例えば高音質な音声データを必要としない利用者にとっては試聴用の音声データで充分であるから、課金処理を実行する充分な誘因を利用者に付与する(ひいては効果的な収益化を実現する)ことは実際には困難である。他方、極端に低音質の音声データを試聴用に提供すれば、購入手続を実行しようとする利用者の意欲をかえって減殺しかねない。以上の事情を考慮して、本発明は、音響信号の生成機能の制限を解除する誘因を有効に維持しながら音響信号の生成機能を効果的に制限することを目的とする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本発明の第1態様に係る音響生成装置は、第1動作モードまたは第2動作モードを選択する制御手段と、第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成手段とを具備する。以上の構成によれば、第2動作モードでの音響信号の発音内容が第1動作モードと比較して制限されるから、低音質の音声データを試聴のために利用者に提供する特許文献1の技術と比較すると、第1動作モードに移行する誘因を利用者に付与しながら第2動作モードにて音響信号の生成機能を効果的に制限することが可能である。
【0006】
なお、発音内容の設定の自由度とは、利用者からの指示に応じて発音内容が変更され得る度合(利用者が発音内容を自由に設定し得る度合)を意味する。自由度が高いほど、利用者からの指示が発音内容に反映される度合は大きく、自由度が低いほど、利用者からの指示が発音内容に反映される度合は小さい。利用者からの指示とは無関係に発音内容が設定される状態(発音内容が利用者からの指示に依存しない状態)は、自由度が最低である状態に相当する。以上の説明から理解される通り、第2動作モードは、第1動作モードと比較して小さい度合で利用者からの指示を発音内容に反映させる動作モードと、利用者からの指示を発音内容に反映させない動作モードとを包含する。
【0007】
本発明の好適な態様において、音響生成手段は、第2動作モードにおいて、第1動作モードと比較して音声符号(発音文字や音素記号)の種類数が少ない発音内容の音響信号を生成する。以上の態様の具体例は、例えば第1実施形態から第3実施形態として後述される。例えば、利用者の属性情報に対応する音声符号に制限された発音内容の音響信号を生成する構成(例えば後述の第2実施形態)や、利用者の位置情報に対応する音声符号に制限された発音内容の音響信号を生成する構成(例えば後述の第3実施形態)が好適である。
【0008】
また、音響生成手段が、第2動作モードにおいて、利用者からの指示に対して非依存に設定された発音内容(すなわち利用者からの指示とは無関係に選定された発音内容)の音響信号を生成する構成(例えば後述の第4実施形態)や、音響生成手段が、第2動作モードにおいて、利用者からの指示に応じた音声符号を特定の音声符号(代替符号)に置換した発音内容の音響信号を生成する構成(例えば後述の第1実施形態や第5実施形態)も採用され得る。また、音響生成手段が、第2動作モードにおいて、音声符号の総数が第1動作モードと比較して制限された発音内容の音響信号を生成することも可能である。
【0009】
本発明の第2態様に係る音響生成装置は、第1動作モードまたは第2動作モードを選択する制御手段と、第1動作モードでは、利用者からの指示に応じた音高の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する音響生成手段とを具備する。以上の構成によれば、第2動作モードでの音響信号の音高が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較すると、第1動作モードに移行する誘因を利用者に付与しながら第2動作モードにて音響信号の生成機能を効果的に制限することが可能である。
【0010】
なお、音高の設定の自由度とは、利用者からの指示に応じて音高が変更され得る度合(利用者が音高を自由に設定し得る度合)を意味する。自由度が高いほど、利用者からの指示が音高に反映される度合は大きく、自由度が低いほど、利用者からの指示が音高に反映される度合は小さい。利用者からの指示とは無関係に音高が設定される状態(音高が利用者からの指示に依存しない状態)は、自由度が最低である状態に相当する。以上の説明から理解される通り、第2動作モードは、第1動作モードと比較して小さい度合で利用者からの指示を音高に反映させる動作モードと、利用者からの指示を音高に反映させない動作モードとを包含する。
【0011】
具体的には、第2動作モードにおいて、音響生成手段が、第1動作モードと比較して音高の種類数が少ない音響信号を生成する構成(例えば後述の第7実施形態)や、利用者からの指示に対して非依存に設定された音高の音響信号を生成する構成(例えば後述の第8実施形態)が好適である。例えば、自動作曲処理で生成された旋律の音響信号を生成する構成や、事前に用意された旋律の音響信号を生成する構成が採用される。
【0012】
第1態様または第2態様に係る音響生成装置の好適例において、音響生成手段は、第2動作モードにおける音響信号の生成に対する制限の度合を、相異なる第1期間と第2期間とで相違させる。以上の態様によれば、第1動作モードに移行する誘因を利用者に効果的に付与することが可能である。
【0013】
以上の各態様に係る音響生成装置は、音響信号の生成に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)で実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働でも実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。
【0014】
本発明の第1態様に係るプログラムは、第1動作モードまたは第2動作モードを選択する制御処理と、第1動作モードでは、利用者からの指示に応じた発音内容の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号を生成する音響生成処理とをコンピュータに実行させる。また、本発明の第2態様に係るプログラムは、第1動作モードまたは第2動作モードを選択する制御処理と、第1動作モードでは、利用者からの指示に応じた音高の音響信号を生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号を生成する音響生成処理とをコンピュータに実行させる。
【発明を実施するための形態】
【0016】
<第1実施形態>
図1は、本発明の第1実施形態に係る音響生成装置100のブロック図である。第1実施形態の音響生成装置100は、素片接続型の音声合成で歌唱音の音響信号Vを生成する音声合成装置であり、
図1に示すように、演算処理装置10と記憶装置12と通信装置14と入力装置16と放音装置18とを具備するコンピュータシステムで実現される。例えば据置型の情報処理装置(パーソナルコンピュータ)や携帯型の情報処理装置(例えば携帯電話機やスマートフォン等)で音響生成装置100は実現される。
【0017】
通信装置14は、通信網(例えばインターネット)を介して通信する。通信装置14と課金処理装置(図示略)とが通信網を介して通信することで利用者に対する課金処理が実行される。入力装置16は、利用者からの指示を受付ける機器であり、例えば利用者が操作する複数の操作子を含んで構成される。放音装置18(例えばヘッドホンやスピーカ)は、演算処理装置10が生成した音響信号Vに応じた音波を放射する。
【0018】
記憶装置12は、演算処理装置10が実行する音響生成プログラム(アプリケーションソフトウェア)PGMや演算処理装置10が使用する各種のデータ(音声素片群G,制御情報C)を記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数の記録媒体の組合せが記憶装置12として採用される。
【0019】
音声素片群Gは、音響信号Vの素材として利用される複数の音声素片の集合(音声合成ライブラリ)である。音声素片は、言語的な意味の区別の最小単位である音素(例えば母音や子音)や複数の音素を連結した音素連鎖(例えばダイフォンやトライフォン)である。
【0020】
制御情報Cは、複数の音符の時系列で表現される旋律を指定する。
図2に示すように、第1実施形態の制御情報Cは、楽曲内の各音符に各々が対応する複数の音符情報Nの時系列である。各音符情報Nは、音高情報X1と期間情報X2と発音情報X3とを含んで構成される。音高情報X1は、各音符の音高(各音高に対応する番号)を指定する。期間情報X2は、音符の発音期間を例えば音符の開始時刻と継続長とで指定する。なお、音符の開始時刻と終了時刻とで発音期間を規定することも可能である。発音情報X3は、音符の音声符号を指定する。例えば発音文字(書記素)や音素記号等の音声符号が発音情報X3で指定される。
【0021】
演算処理装置10は、記憶装置12に記憶された音響生成プログラムPGMを実行することで、音響信号Vを生成するための複数の機能(動作制御部22,音響生成部24)を実現する。なお、演算処理装置10の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が演算処理装置10の一部の機能を実現する構成も採用され得る。
【0022】
動作制御部22は、音響生成装置100の動作モードを制御する。具体的には、動作制御部22は、第1動作モードと第2動作モードとの一方を選択することが可能である。第1動作モードは、利用者が音響生成装置100(音響生成プログラムPGM)を正規に利用するための動作モードである。他方、第2動作モードは、利用者が音響生成装置100を試用するための動作モード(試用モード,体験モード)である。動作制御部22は、音響生成プログラムPGMが記憶装置12に記憶された直後の初期状態では第2動作モードを選択する。そして、入力装置16に対する利用者からの指示を契機として認証処理や課金処理等の所定の購入処理が通信装置14と課金処理装置(課金サーバ装置)との間で実行され、購入処理が適正に完了した場合に、動作制御部22は動作モードを第2動作モードから第1動作モードに移行する。なお、購入処理の内容は任意である。例えば課金処理装置との間で通信せずに音響生成装置100の単体で購入処理を実行することも可能である。
【0023】
音響生成部24は、記憶装置12に記憶された音声素片群Gと制御情報Cとを利用して音響信号Vを生成する。
図3は、第1実施形態の音響生成部24のブロック図である。
図3に示すように、音響生成部24は、情報編集部32と合成処理部34とを含んで構成される。
【0024】
利用者は、入力装置16を適宜に操作することで音高情報X1と期間情報X2と発音情報X3とを音符毎に指示することが可能である。
図3の情報編集部32は、入力装置16に対する利用者からの指示に応じて制御情報C(音高情報X1,期間情報X2,発音情報X3)を生成および編集する。
【0025】
第1実施形態の情報編集部32は、発音情報X3に指定可能な音声符号(発音文字や音素記号)の範囲を第1動作モードと第2動作モードとで相違させる。具体的には、情報編集部32は、第2動作モードで発音情報X3に設定可能な音声符号を、第1動作モードで発音情報X3に設定可能な音声符号と比較して制限する。すなわち、第2動作モードでは、音声素片群Gの複数の音声素片のうち特定の音声素片の集合に対応する範囲(以下「発音制限範囲」という)QA内の音声符号のみが発音情報X3の候補として利用者に許可され、第1動作モードでは、利用者が発音情報X3として指示可能な候補が音声素片群G内の全部の音声素片に対応する音声符号まで拡張される。例えば、音名に対応する音声符号(ドレミファソラシド)の範囲が発音制限範囲QAとして好適である。なお、音高情報X1および期間情報X2について利用者が指示可能な範囲は第1動作モードと第2動作モードとで共通する。
【0026】
具体的には、情報編集部32は、利用者が指示した音声符号が発音制限範囲QA内の音声符号に該当するか否かを判定し、発音制限範囲QA内の音声符号に該当する場合にはその音声符号を発音情報X3に設定する一方、発音制限範囲QA内の音声符号に該当しない場合には、利用者が指示した音声符号を特定の音声符号(以下「代替符号」という)に置換する。代替符号は、利用者からの指示とは無関係に事前に選定された音声符号である。代替符号に対応する音声素片は音声素片群Gに包含される。例えば楽曲の歌詞として一般的な「ラ」等の音声符号や「ピー」等の擬声語の音声符号が代替符号として好適である。また、無音の音声符号を代替符号として利用することも可能である。
【0027】
合成処理部34は、記憶装置12内の音声素片群Gと制御情報Cとを利用して音響信号Vを生成する。具体的には、合成処理部34は、音高情報X1が指定する音高と期間情報X2が指定する発音期間とに対応する各音符を、制御情報Cの発音情報X3に対応する音声符号で発声した音声(歌唱音)の音響信号Vを生成する。具体的には、合成処理部34は、制御情報Cの各音符情報Nの発音情報X3に対応する音声素片を音声素片群Gから順次に選択したうえで音高情報X1の音高と期間情報X2の発音期間とに調整し、調整後の各音声素片を相互に連結することで音響信号Vを生成する。合成処理部34が生成した音響信号Vが放音装置18に供給されて音波として再生される。なお、制御情報Cに応じた音響信号Vの生成には公知の音声合成技術が任意に採用される。
【0028】
第1動作モードでは音声素片群G内の全部の音声素片に対応する音声符号を候補として発音情報X3が指定され、第2動作モードで発音情報X3の候補となる音声符号は発音制限範囲QA内に制限される。したがって、第1実施形態の音響生成部24は、第1動作モードと比較して音声符号(発音記号や音素記号)の種類数が少ない音響信号Vを第2動作モードにて生成する要素として機能する。第2動作モードにおける音声符号の制限(発音制限範囲QA)が第1動作モードでは解除されると換言することも可能である。
【0029】
以上に説明した通り、第1実施形態では、第2動作モードでの音響信号Vの発音内容(音声符号の種類数)が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較して音響生成装置100の機能が有効に制限され、購入処理の実行で第2動作モードを第1動作モードに移行させる(音響信号Vの生成機能の制限を解除する)充分な誘因を利用者に付与することが可能である。
【0030】
<第2実施形態>
本発明の第2実施形態を以下に説明する。第1実施形態では、第2動作モードで発音情報X3の候補となる音声符号の発音制限範囲QAを事前に設定した。第2実施形態では発音制限範囲QAが可変に設定される。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0031】
第2実施形態の記憶装置12は、利用者の属性情報を記憶する。属性情報は、例えば利用者の氏名等の個人情報や利用者の趣味や嗜好を指定する情報を含んで構成される。情報編集部32は、記憶装置12に記憶された利用者の属性情報に応じて発音制限範囲QAを可変に設定する。例えば、属性情報が示す利用者の氏名の音声符号(発音文字や音素記号)を包含するように発音制限範囲QAを設定する構成や、属性情報が示す利用者の趣味や嗜好に関連する単語の音声符号を包含するように発音制限範囲QAを設定する構成が好適に採用される。第1動作モードでは、第1実施形態と同様に、発音制限範囲QAの制限が解除される。
【0032】
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第2実施形態の音響生成部24は、利用者の属性情報に対応する音声符号に制限された発音内容の音響信号Vを第2動作モードにて生成する要素として機能する。以上の説明から理解されるように、第2実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。また、第2実施形態では、利用者の属性情報に応じて発音制限範囲QAが可変に設定されるから、発音制限範囲QAの制限の範囲内で利用者の属性情報を反映した発音内容の音響信号Vを生成できるという利点がある。
【0033】
<第3実施形態>
図4は、第3実施形態の音響生成装置100のブロック図である。
図4に示すように、第3実施形態の音響生成装置100は、位置検出装置40を第1実施形態に追加した構成である。位置検出装置40は、音響生成装置100の位置(利用者の位置)を検出する。例えば、位置検出装置40は、複数のGPS(Global Positioning System)衛星からの電波を受信して位置情報を生成する。
【0034】
第3実施形態の情報編集部32は、第2実施形態と同様に、第2動作モードで発音情報X3の候補となる音声符号の発音制限範囲QAを可変に設定する。具体的には、情報編集部32は、位置検出装置40が生成した位置情報に応じて発音制限範囲QAを可変に設定する。例えば、位置情報が示す位置に関連する単語(例えば地名等や施設名等)の音声符号を包含するように発音制限範囲QAを設定する構成が好適である。第1動作モードでは、第1実施形態と同様に、発音制限範囲QAの制限が解除される。
【0035】
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第3実施形態の音響生成部24は、利用者の位置情報に対応する音声符号に制限された発音内容の音響信号Vを第2動作モードにて生成する要素として機能する。以上の説明から理解されるように、第3実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。また、第3実施形態では、利用者の位置情報に応じて発音制限範囲QAが可変に設定されるから、発音制限範囲QAの制限の範囲内で利用者の位置情報を反映した発音内容の音響信号Vを生成できるという利点がある。また、利用者の位置に応じて相異なる発音内容の音響信号Vを生成できるという興趣性を利用者に提供することも可能である。
【0036】
<第4実施形態>
第1実施形態から第3実施形態では、発音制限範囲QA内で利用者からの指示に応じて発音情報X3を設定した。第4実施形態の情報編集部32は、第2動作モードにおいて、利用者からの指示に対して非依存な音声符号(発音文字や音素記号)を発音情報X3として指定する。
【0037】
具体的には、情報編集部32は、制御情報C内の各音符情報Nの発音情報X3をランダムに設定する。例えば、情報編集部32は、事前に用意された複数の候補から単語を順次にランダムに選択し、各単語に対応する音声符号を順番に各発音情報X3に割当てる。発音情報X3の候補を発音制限範囲QA内の音声符号に制限するか否かは不問である。また、事前に用意された文章に対応する音声符号を順番に各発音情報X3に割当てる構成も採用され得る。第1動作モードでは、第1実施形態と同様に、利用者が指示した任意の音声符号が発音情報X3として指定され得る。
【0038】
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第4実施形態の音響生成部24は、利用者からの指示に対して非依存に設定された発音内容(すなわち利用者からの指示とは無関係に選定された発音内容)の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第4実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
【0039】
<第5実施形態>
第5実施形態の情報編集部32は、第1動作モードおよび第2動作モードの双方において、利用者が任意の音声符号を発音情報X3として指定することが可能である。ただし、第2動作モードでは、情報編集部32は、利用者からの指示に応じて設定された発音情報X3の一部を、利用者からの指示に非依存な代替符号(例えば第1実施形態で例示した「ラ」や「ピー」等の音声符号)に置換する。例えば、利用者が指示した複数の発音情報X3の時系列からランダムに選択された各発音情報X3が代替符号に置換される。第1動作モードでは、第1実施形態と同様に、利用者が指示した任意の音声符号が発音情報X3として指定される。
【0040】
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第5実施形態の音響生成部24は、第2動作モードにおいて、利用者が指示した音声符号を特定の音声符号(代替符号)に置換した発音内容の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第5実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
【0041】
<第6実施形態>
第6実施形態の情報編集部32は、制御情報Cで指定可能な音符数の最大値(以下「最大音符数」という)Mを第1動作モードと第2動作モードとで相違させる。具体的には、第2動作モードでの最大音符数M2は第1動作モードでの最大音符数M1を下回る。すなわち、第2動作モードでは第1動作モードと比較して音響信号Vの最大音符数Mが制限される。音高情報X1と期間情報X2と発音情報X3とは音符毎に設定されるから、音高情報X1で指定される音高の総数や発音情報X3で指定される音声符号の総数も第2動作モードでは第1動作モードと比較して制限される。
【0042】
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第6実施形態の音響生成部24は、第2動作モードにおいて、音声符号の総数(最大音符数M)が第1動作モードと比較して制限された発音内容の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第6実施形態においても、第2動作モードでの音響信号Vの発音内容が第1動作モードと比較して制限されるから、第1実施形態と同様の効果が実現される。
【0043】
<第7実施形態>
第1実施形態から第6実施形態では、制御情報C内の各音符情報Nの音高情報X1を利用者が任意に指示できる構成を例示した。第7実施形態では、音高情報X1に設定可能な音高の範囲を第1動作モードと第2動作モードとで相違させる。
【0044】
具体的には、情報編集部32は、第2動作モードで音高情報X1に設定可能な音高の範囲を、第1動作モードで音高情報X1に設定可能な音高の範囲と比較して制限する。すなわち、第2動作モードでは、第1動作モードで設定可能な複数の音高から選択された特定の範囲(以下「音高制限範囲」という)QB内の音高のみが音高情報X1の候補として利用者に許可され、第1動作モードでは、利用者が音高情報X1として指示可能な候補が全種類の音高に拡張される。例えば、鍵盤楽器の白鍵に対応する7個の幹音(黒鍵に対応する派生音以外の音高)を音高制限範囲QBに設定した構成や、所定の3個の音高(例えばドレミ)のみを音高制限範囲QBに設定した構成が採用される。また、特定のスケール(例えばアイオニアンスケールや琉球スケール)や特定の音域(オクターブ)に属する各音高を音高制限範囲QBに設定することも可能である。
【0045】
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第7実施形態の音響生成部24は、第1動作モードと比較して音高の種類数が少ない音響信号Vを第2動作モードにて生成する要素として機能する。第2動作モードにおける音高の制限(音高制限範囲QB)が第1動作モードでは解除されると換言することも可能である。なお、以上の説明では発音情報X3が指定する音高の制限のみに着目したが、発音情報X3が指定する音声符号の制限については第1実施形態から第6実施形態の何れかの構成が任意に採用される。
【0046】
以上に説明した通り、第7実施形態では、第2動作モードでの音響信号Vの音高が第1動作モードと比較して制限されるから、低音質の音声データを試聴用に利用者に提供する特許文献1の技術と比較して音響生成装置100の機能が有効に制限され、購入処理の実行で第2動作モードを第1動作モードに移行させる(音響信号Vの生成機能の制限を解除する)充分な誘因を利用者に付与することが可能である。
【0047】
<第8実施形態>
第7実施形態では、音高制限範囲QB内で利用者からの指示に応じて音高情報X1を設定した。第8実施形態の情報編集部32は、第2動作モードにおいて、利用者からの指示に対して非依存な音高(すなわち、利用者からの指示とは無関係に選定された音高)を制御情報C内の各音高情報X1として指定する。
【0048】
具体的には、情報編集部32は、第2動作モードにおいて、自動作曲処理で生成した旋律の各音高を順番に各音高情報X1に割当てる。自動作曲処理には公知の技術が任意に採用される。なお、利用者が指示した単語や文章(例えば利用者が発音情報X3として指示した各音声符号の配列)に応じた旋律を生成することも可能である。また、事前に用意された旋律の各音高を各音高情報X1に割当てる構成も採用され得る。第1動作モードでは、音高の制限が解除され、利用者からの指示に応じた音高の音響信号Vが生成される。
【0049】
音声素片群Gと制御情報Cとを利用した音響信号Vの生成は第1実施形態と同様である。したがって、第8実施形態の音響生成部24は、利用者からの指示に対して非依存に設定された音高の音響信号Vを生成する要素として機能する。以上の説明から理解される通り、第7実施形態においても、第2動作モードでの音響信号Vの音高が第1動作モードと比較して制限されるから、第7実施形態と同様の効果が実現される。
【0050】
<第9実施形態>
第9実施形態の音響生成部24は、第2動作モードでの音響信号Vの生成に対する制限の度合を、購入処理の実行前の複数の期間の各々で個別に設定する。例えば、音響生成プログラムPGMが記憶装置12に記憶された直後の所定長(例えば3日間)にわたる第1期間A1では、発音制限範囲QAがサ行(サシスセソ)に設定され、音高制限範囲QBがCメジャースケールに設定される。第1期間A1の経過後の所定長(例えば7日間)にわたる第2期間A2では、発音制限範囲QAが音名に対応する音声符号(ドレミファソラシド)に設定され、音高情報X1が第8実施形態における自動作曲処理の旋律に制限される。第2期間A2の経過から購入処理の完了(第1動作モードへの移行)までの第3期間A3では、発音制限範囲QAが「ラ」に設定され、音高情報X1が所定の旋律の各音高に制限される。なお、音響信号Vの生成機能の制限(発音内容や音高の制限)を経時的に強化する構成と生成機能の制限を経時的に緩和する構成の双方が想定され得る。
【0051】
第9実施形態においても前述の各形態と同様の効果が実現される。また、第9実施形態では、音響信号Vの生成に対する制限が可変に制御されるから、購入処理の実行で第1動作モードに移行する誘因を利用者に対して効果的に付与することが可能である。なお、以上の例示では、発音情報X3に指定される音声符号の制限と音高情報X1に指定される音高の制限との双方を経時的に変化させたが、音声符号および音高の一方の制限のみを経時的に変化させることも可能である。
【0052】
<変形例>
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
【0053】
(1)第2動作モードで発音情報X3に指定される音声符号(発音文字や音素記号)を第1動作モードと比較して制限する方法は前述の例示に限定されない。第1実施形態から第6実施形態の音響生成部24は、第1動作モードでは利用者からの指示に応じた発音内容(発音情報X3)の音響信号Vを生成し、第2動作モードでは、第1動作モードと比較して低い自由度で発音内容が設定された音響信号Vを生成する要素として包括される。
【0054】
また、前述の各形態では、歌唱音の音響信号Vを生成する場合を想定したため、制御情報Cが音高情報X1および期間情報X2を含む構成を例示したが、音高情報X1や期間情報X2は第1実施形態から第6実施形態から省略され得る。すなわち、音高の経時的な変化を要件としない会話音等の音声の音響信号Vの生成にも第1実施形態から第6実施形態は適用され得る。
【0055】
(2)第2動作モードで音高情報X1に指定される音高を第1動作モードと比較して制限する方法は前述の例示に限定されない。第7実施形態および第8実施形態の音響生成部24は、第1動作モードでは利用者からの指示に応じた音高の音響信号Vを生成し、第2動作モードでは、第1動作モードと比較して低い自由度で音高が設定された音響信号Vを生成する要素として包括される。また、発音情報X3に指定される音声符号を第2動作モードで制限する構成は第7実施形態や第8実施形態から省略され得る。
【0056】
また、第7実施形態および第8実施形態では、歌唱音の音響信号Vを生成する場合を想定したため、制御情報Cが発音情報X3を含む構成を例示したが、発音情報X3は第7実施形態や第8実施形態から省略され得る。すなわち、音高情報X1が指定する音高と期間情報X2が指定する発音期間とで規定される音符の楽音(例えば楽器の演奏音)の音響信号Vを生成する場合にも第7実施形態や第8実施形態は適用され得る。
【0057】
(3)前述の各形態では、記憶装置12に記憶された音声素片群Gのうち発音制限範囲QA内の音声符号に対応する音声素片を第2動作モードで選択的に利用して音響信号Vを生成したが、第1動作モードで利用される音声素片群G1と第2動作モードで利用される音声素片群G2とを個別に用意することも可能である。音声素片群G1は、利用者が音響生成装置100を正規に利用する(音響生成装置100の全部の機能を利用する)ための音声合成ライブラリであり、音声素片群G2は、利用者が音響生成装置100を試用するための試用版(特定の機能を制限して音響生成装置100の利用を許可する体験版)の音声合成ライブラリである。各音声素片の発声者は音声素片群G1と音声素片群G2とで共通するが、音声素片群G1内の音声素片の種類数は音声素片群G2内の音声素片の種類数を上回る。すなわち、音声素片群G2は音声素片群G1のうち発音制限範囲QA内の音声符号に対応する音声素片の部分集合に相当する。したがって、音声素片群G2のデータ量は音声素片群G1のデータ量を下回る。
【0058】
音響生成プログラムPGMの導入直後の初期状態では音声素片群G2が記憶装置12に記憶され、購入処理が適正に完了することを条件に音声素片群G1が配信装置から通信装置14に配信されて記憶装置12に記憶される。以上の構成によれば、購入処理を実行しない場合には音声素片群G1を記憶装置12に格納する必要がないから、音声素片群G1の送受信時の通信量や音声素片群G1の記憶容量が削減されるという利点がある。
【0059】
(4)第2動作モードでは音響信号Vの生成に利用される音声素片の種類数が第1動作モードと比較して少ないという事情を考慮すると、第2動作モードにおいて音響信号Vの生成に必要な音声素片を動作毎に配信装置から通信装置14が取得する構成も好適である。すなわち、動作モードが第2動作モードから第1動作モードに移行するまでは記憶装置12に音声素片(音声素片群G)が記憶されない。
【0060】
(5)第7実施形態における音高制限範囲QBの設定に第2実施形態の属性情報や第3実施形態の位置情報を利用することも可能である。すなわち、情報編集部32は、利用者の属性情報や位置情報に応じて音高制限範囲QBを可変に設定する。
【0061】
(6)前述の各形態では、購入処理の実行を条件として第2動作モードから第1動作モードに移行する場合を例示したが、動作モードの移行の方向や条件は適宜に変更される。例えば、音響生成プログラムPGMの導入の直後の初期状態では第1動作モードを選択し、購入処理が実行されずに所定の期間が経過した場合に第1動作モードから第2動作モードに移行する構成も採用され得る。また、音響信号Vの生成に対する制限の度合が相違する3種類以上の動作モードから何れかの動作モードを選択する構成も採用され得る。例えば、利用者が支払う金額に応じて段階的に動作モード(音響信号Vの生成に対する制限の度合)を変更することも可能である。音響信号Vの生成に対する制限の度合を利用者に通知する構成も採用され得る。例えば、動作モードを利用者に通知する画像(ポップアップ方式のダイアログ)を表示装置に表示する構成や、動作モードを通知する電子メールを利用者の登録アドレスに送信する構成が好適である。
【0062】
また、例えば利用者がプレイするゲームで特定の条件(例えば所定のステージのクリア)を充足することや音響生成プログラムPGMに関するアンケートに回答すること等の各種の条件を、動作モード(音響信号Vの生成に対する制限の度合)の変更の条件とすることも可能である。
【0063】
以上の説明から理解される通り、前述の各形態における動作制御部22は、音響信号Vの生成に対する制限の度合が相違する第1動作モードまたは第2動作モードを選択する要素として包括され、動作モードの移行の方向や条件および動作モードの総数は本発明において任意である。