(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-21
(45)【発行日】2023-09-29
(54)【発明の名称】音声再生システムおよびプログラム
(51)【国際特許分類】
G10L 19/00 20130101AFI20230922BHJP
【FI】
G10L19/00 312E
(21)【出願番号】P 2019193760
(22)【出願日】2019-10-24
【審査請求日】2022-06-20
(73)【特許権者】
【識別番号】000220262
【氏名又は名称】東京瓦斯株式会社
(74)【代理人】
【識別番号】100104880
【氏名又は名称】古部 次郎
(74)【代理人】
【識別番号】100125346
【氏名又は名称】尾形 文雄
(74)【代理人】
【識別番号】100166981
【氏名又は名称】砂田 岳彦
(72)【発明者】
【氏名】榎本 奈津子
(72)【発明者】
【氏名】長谷川 昌美
(72)【発明者】
【氏名】田中 彩乃
【審査官】菊池 智紀
(56)【参考文献】
【文献】特開2014-007561(JP,A)
【文献】特開2004-094113(JP,A)
【文献】特開2001-282291(JP,A)
【文献】特開2004-135010(JP,A)
【文献】特開2012-100798(JP,A)
【文献】特開2008-123674(JP,A)
【文献】特開2006-236504(JP,A)
【文献】特開2016-061855(JP,A)
【文献】特開2012-194347(JP,A)
【文献】特開2002-056613(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 19/00
G11B 20/10
A63H 1/00-37/00
G10K 15/00-15/12
(57)【特許請求の範囲】
【請求項1】
ユーザが置き換えに参加して編集可能な音声情報ファイルを取得する取得手段と、
前記音声情報ファイルに含まれる音声を再生する再生手段と、
前記音声情報ファイルを編集する編集手段と、
音声の置き換えによる編集が行われた音声情報ファイルを、当該音声情報ファイルの編集情報と関連付けて、前記取得手段により取得された音声情報ファイルとは別に保存する保存手段と、
前記編集情報に基づいて前記編集が行われた音声情報ファイルの一覧を作成し提示する提示手段と、
提示された前記音声情報ファイルのうち、再生する音声情報ファイルの指定を受け付け、前記再生手段に再生させる再生制御手段と、を備え
、
前記編集手段は、前記音声情報ファイルのコンテンツを複数の部分に分割し、当該コンテンツに含まれる音声に対して当該部分ごとに音声を他の音声と置き換える編集が可能であり、
前記再生制御手段は、
前記音声情報ファイルを再生する際に、前記部分ごとに、前記編集が行われた音声情報ファイルにおける置き換えた音声で再生可能であり、
一のコンテンツに係る音声情報ファイルに関して、当該コンテンツの前記部分に対して前記音声を置き換える編集が行われた音声情報ファイルが複数存在する場合に、当該コンテンツの当該部分ごとに、ファイルの生成順にしたがって、当該編集が行われた音声情報ファイルの音声を割り当てて再生することを特徴とする、音声再生システム。
【請求項2】
前記編集手段は、複数の前記編集が行われた音声情報ファイルの音声を組み合わせて、新たな音声情報ファイルを生成することを特徴とする、請求項1に記載の音声再生システム。
【請求項3】
前記編集情報は、前記編集において置き換えられた音声を発声したユーザの年齢の情報を含み、
前記再生制御手段は、一のコンテンツに係る音声情報ファイルに関して、当該コンテンツの前記部分に対して前記音声を置き換える編集が行われた音声情報ファイルが複数存在する場合に、当該コンテンツの当該部分ごとに、複数の当該音声ファイルに関連付けられた前記編集情報に示される前記ユーザの年齢順にしたがって、当該編集が行われた音声情報ファイルの音声を割り当てて再生することを特徴とする、請求項1に記載の音声再生システム。
【請求項4】
コンピュータを制御して、
ユーザが置き換えに参加して編集可能な音声情報ファイルを取得する取得手段と、
前記音声情報ファイルに含まれる音声を再生する再生手段と、
前記音声情報ファイルを編集する編集手段と、
音声の置き換えによる編集が行われた音声情報ファイルを、当該音声情報ファイルの編集情報と関連付けて、前記取得手段により取得された音声情報ファイルとは別に保存する保存手段と、
前記編集情報に基づいて前記編集が行われた音声情報ファイルの一覧を作成し提示する提示手段と、
提示された前記音声情報ファイルのうち、再生する音声情報ファイルの指定を受け付け、前記再生手段に再生させる再生制御手段として、機能させ
、
前記編集手段の機能として、前記音声情報ファイルのコンテンツを複数の部分に分割し、当該コンテンツに含まれる音声に対して当該部分ごとに音声を他の音声と置き換える編集が可能であり、
前記再生制御手段の機能として、
前記音声情報ファイルを再生する際に、前記部分ごとに、前記編集が行われた音声情報ファイルにおける置き換えた音声で再生可能であり、
一のコンテンツに係る音声情報ファイルに関して、当該コンテンツの前記部分に対して前記音声を置き換える編集が行われた音声情報ファイルが複数存在する場合に、当該コンテンツの当該部分ごとに、ファイルの生成順にしたがって、当該編集が行われた音声情報ファイルの音声を割り当てて再生することを特徴とする、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声再生システムおよびプログラムに関する。
【背景技術】
【0002】
従来、映画などの物語の画面に合わせて台詞や音楽などを録音するアフターレコーディング(いわゆるアフレコ)技術が存在する。
【0003】
特許文献1には、物語との一体感を楽しみながら、声優を純粋に体験するための装置の例が記載されている。この装置には、プレーヤが選択した配役以外の音声を再生する機能と、プレーヤが選択した配役が発声するタイミングで、プレーヤが選択した配役の台詞に対応するテロップだけを表示する機能とが設けられている。このため、プレーヤは、テロップに合わせて発声するだけで、アフレコを体験できる。なお、表示画面には、アニメ、ドラマ等の動画が表示されるので、プレーヤは、物語との一体感を楽しむことができる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
アフレコの技術は、昔話などを録音したオーディオブックにも応用されている。オーディオブックは、子供の成長に伴い、年代に応じて、滑舌や抑揚のつけ方、台詞に対する心情の込め方等も変化すると考えられ、子供の発声の録音は、子供の成長の記録となる。しかし、録音された音声を分類して聴き比べるには、音声ファイルを主体別、年代別に特定して抽出する等の手間を要する。
【0006】
本発明は、録音された音声ファイルを予め定められた条件により分類して提示し、過去の録音の聴き比べという、オーディオブックにおける新たな楽しみを提供することを目的とする。
【課題を解決するための手段】
【0007】
請求項1に係る発明は、
ユーザが置き換えに参加して編集可能な音声情報ファイルを取得する取得手段と、
前記音声情報ファイルに含まれる音声を再生する再生手段と、
前記音声情報ファイルを編集する編集手段と、
音声の置き換えによる編集が行われた音声情報ファイルを、当該音声情報ファイルの編集情報と関連付けて、前記取得手段により取得された音声情報ファイルとは別に保存する保存手段と、
前記編集情報に基づいて前記編集が行われた音声情報ファイルの一覧を作成し提示する提示手段と、
提示された前記音声情報ファイルのうち、再生する音声情報ファイルの指定を受け付け、前記再生手段に再生させる再生制御手段と、を備え、
前記編集手段は、前記音声情報ファイルのコンテンツを複数の部分に分割し、当該コンテンツに含まれる音声に対して当該部分ごとに音声を他の音声と置き換える編集が可能であり、
前記再生制御手段は、
前記音声情報ファイルを再生する際に、前記部分ごとに、前記編集が行われた音声情報ファイルにおける置き換えた音声で再生可能であり、
一のコンテンツに係る音声情報ファイルに関して、当該コンテンツの前記部分に対して前記音声を置き換える編集が行われた音声情報ファイルが複数存在する場合に、当該コンテンツの当該部分ごとに、ファイルの生成順にしたがって、当該編集が行われた音声情報ファイルの音声を割り当てて再生することを特徴とする、音声再生システムである。
請求項2に係る発明は、
前記編集手段は、複数の前記編集が行われた音声情報ファイルの音声を組み合わせて、新たな音声情報ファイルを生成することを特徴とする、請求項1に記載の音声再生システムである。
請求項3に係る発明は、
前記編集情報は、前記編集において置き換えられた音声を発声したユーザの年齢の情報を含み、
前記再生制御手段は、一のコンテンツに係る音声情報ファイルに関して、当該コンテンツの前記部分に対して前記音声を置き換える編集が行われた音声情報ファイルが複数存在する場合に、当該コンテンツの当該部分ごとに、複数の当該音声ファイルに関連付けられた前記編集情報に示される前記ユーザの年齢順にしたがって、当該編集が行われた音声情報ファイルの音声を割り当てて再生することを特徴とする、請求項1に記載の音声再生システムである。
請求項4に係る発明は、
コンピュータを制御して、
ユーザが置き換えに参加して編集可能な音声情報ファイルを取得する取得手段と、
前記音声情報ファイルに含まれる音声を再生する再生手段と、
前記音声情報ファイルを編集する編集手段と、
音声の置き換えによる編集が行われた音声情報ファイルを、当該音声情報ファイルの編集情報と関連付けて、前記取得手段により取得された音声情報ファイルとは別に保存する保存手段と、
前記編集情報に基づいて前記編集が行われた音声情報ファイルの一覧を作成し提示する提示手段と、
提示された前記音声情報ファイルのうち、再生する音声情報ファイルの指定を受け付け、前記再生手段に再生させる再生制御手段として、機能させ、
前記編集手段の機能として、前記音声情報ファイルのコンテンツを複数の部分に分割し、当該コンテンツに含まれる音声に対して当該部分ごとに音声を他の音声と置き換える編集が可能であり、
前記再生制御手段の機能として、
前記音声情報ファイルを再生する際に、前記部分ごとに、前記編集が行われた音声情報ファイルにおける置き換えた音声で再生可能であり、
一のコンテンツに係る音声情報ファイルに関して、当該コンテンツの前記部分に対して前記音声を置き換える編集が行われた音声情報ファイルが複数存在する場合に、当該コンテンツの当該部分ごとに、ファイルの生成順にしたがって、当該編集が行われた音声情報ファイルの音声を割り当てて再生することを特徴とする、プログラムである。
【発明の効果】
【0008】
請求項1の発明によれば、音声情報を含む一つのコンテンツ中で、録音された音声情報ファイルをファイルの生成順に再生することにより、録音時期に従って次第に変化する音声を聞き比べる楽しみを提供することができる。
請求項2の発明によれば、一つの音声情報ファイル中で、異なる音声情報ファイルの音声を聴き比べることができる。
請求項3の発明によれば、ユーザの年齢順に従って次第に変化するユーザの音声を聞き比べることができる。
請求項4の発明によれば、本発明のプログラムを実行するコンピュータにおいて、録音された音声情報ファイルを予め定められた条件により分類して提示し、過去の録音の聴き比べという、オーディオブックにおける新たな楽しみを提供することができる。
【図面の簡単な説明】
【0009】
【
図1】実施の形態で想定するネットワークシステムの概要を説明する図である。
【
図2】実施の形態で使用する端末の構成例を示す図である。
【
図3】端末を構成する制御ユニットの機能構成を説明する図である。
【
図4】オーディオファイル管理サーバの構成例である。
【
図5】オーディオファイル管理サーバの機能構成を示す図である。
【
図6】端末による編集済みオーディオブックの再生動作を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<システム構成>
図1は、実施の形態で想定するネットワークシステム1の概要を説明する図である。
図1に示すネットワークシステム1は、インターネット10に接続されたオーディオファイル管理サーバ20と、ユーザが操作する端末30とで構成されている。
【0011】
本実施の形態におけるオーディオファイル管理サーバ20は、本等を朗読する音声や背景音等をデータとして記録したファイル(以下「オーディオファイル」という)を配信用に管理するサーバである。オーディオファイル管理サーバ20は、コンピュータを基本構成とする。
図1の場合、オーディオファイル管理サーバ20は1台であるが、複数台の装置が協働してオーディオファイル管理サーバ20として動作しても良い。
【0012】
本実施の形態では、ユーザとの間で取引の単位となるオーディオファイルを総称してオーディオブックともいう。オーディオブックは、1つのオーディオファイルで構成される場合もあれば、複数のオーディオファイルで構成される場合もある。本実施の形態では、登場人物の台詞等で話が展開されるオーディオブックの類を音物語という。音物語には、例えば昔話や童話がある。
【0013】
また、オーディオファイル管理サーバ20が配信するオーディオブックには、ユーザが自由に音を挿入することが可能な領域部分、または、元の音と置き換えが可能な領域部分を示す情報が付属されているものとする。ここでのオーディオブックは、音声情報ファイルの一例である。また、本実施の形態の場合、音を挿入することが可能な領域と音の置き換えが可能な領域とを区別して説明するが、音を挿入する処理は、無音の領域を有音の領域に置き換える処理である。このため、音を挿入することが可能な領域は、広義には、音の置き換えが可能な領域と言い得る。
【0014】
挿入が可能な領域部分または置き換えが可能な領域部分が定められているオーディオブックは、編集が可能な音物語のファイルの一例である。どの領域部分を挿入が可能な領域部分とするか、または、置き換えが可能な領域部分とするかは、オーディオブックを配信する側が事前に定めている。ここでの領域部分の多くは台詞である。もっとも、ユーザによる音の挿入や置換が可能な領域部分は、オーディオブックに現れる台詞の全てである必要はなく、特定の登場人物の台詞に限定される必要もない。また、ユーザによる音の挿入や置換が可能な領域部分は、ナレーションの一部分でも良い。
【0015】
本実施の形態における端末30は、オーディオブックをダウンロードするユーザが主に操作する情報機器である。端末30としては、例えば、スマートフォン、タブレット端末、オーディオプレーヤ、ノートパソコン等が用いられる。端末30には、インターネット10を介してオーディオファイル管理サーバ20にアクセスし、前述したオーディオブックをダウンロードすることが可能な機能が設けられている。もっとも、オーディオファイル管理サーバ20との接続は、他の機器を介して実現されても良い。
【0016】
<端末30のハードウェア構成>
図2は、実施の形態で使用する端末30の構成例を示す図である。本実施の形態における端末30は、装置全体の動作を制御する制御ユニット301と、データを記録する不揮発性の記憶ユニット302と、ユーザインタフェース画面等の表示に用いられる表示ユニット303と、ユーザの操作を受け付ける操作受付ユニット304と、電気信号を音として再生するスピーカ305と、音を電気信号に変換するマイク306と、通信インタフェース(=通信IF)307とを有している。
【0017】
本実施の形態における制御ユニット301は、CPU(=Central Processing Unit)311と、ファームウェア等が記録されたROM(=Read Only Memory)312と、ワークエリアとして用いられるRAM(=Random Access Memory)313とを有している。制御ユニット301は、いわゆるコンピュータとして機能する。なお、ROM312は、不揮発性の書き換え可能な半導体メモリである。
【0018】
記憶ユニット302は、磁気ディスク装置やSSD(=Solid State Drive)等の不揮発性の書き換え可能な半導体メモリ等によって構成される。記憶ユニット302には、例えばオーディオブックのデータやマイク306で収録された音のデータ等が保存される。
【0019】
表示ユニット303は、例えば液晶ディスプレイや有機ELディスプレイで構成される。表示ユニット303には、ユーザによる操作を支援する操作画面やユーザに各種の情報を提示する情報画面などが表示される。
【0020】
操作受付ユニット304は、ユーザによる操作を受け付ける操作デバイスにより構成される。操作受付ユニット304は、例えば表示ユニット303の表面に配置されるタッチセンサ、筐体に配置されるスイッチ、ボタンで構成される。
【0021】
通信インタフェース307は、インターネット10を介してオーディオファイル管理サーバ20と通信を行うためのインタフェースである。通信インタフェース307としては、例えば無線LAN(=Local Area Network)、ブルートゥース(登録商標)、移動通信規格に準拠した無線装置が用いられる。
【0022】
なお、制御ユニット301と各ユニット等とは、バス308や不図示の信号線を通じて接続されている。また、不図示であるが、端末30には、位置情報を取得するGPS(=Global Positioning System)センサ、地磁気センサ、加速度センサ、動画像や静止画像を撮像するカメラ等が実装されている。ここでの位置情報は、音が収録された場所の記録にも使用される。
【0023】
<端末30の機能>
図3は、端末30を構成する制御ユニット301の機能構成を説明する図である。
図3に示す機能モジュールは、CPU311(
図2参照)がプログラムを実行することにより実現される。なお、
図3に示す機能モジュールは、制御ユニット301が実行するプログラムの一例である。
図3に示すように、かかるプログラムにより実現される機能モジュールには、オーディオブック取得モジュール321、オーディオブック再生モジュール322、オーディオブック編集モジュール323、編集済みオーディオブック保存モジュール324、提示画面表示制御モジュール325、再生制御モジュール326が含まれる。
【0024】
オーディオブック取得モジュール321は、オーディオファイル管理サーバ20(
図1参照)からオーディオブックを取得する機能モジュールである。取得の対象であるオーディオブックは、端末30(
図1参照)の操作画面を通じてユーザが指定する。なお、オーディオブックは、オーディオファイル管理サーバ20から取得する以外に、記憶ユニット302(
図2参照)から取得する場合もある。オーディオブック取得モジュール321は、取得手段の一例である。
【0025】
オーディオブック再生モジュール322は、オーディオブックを再生する機能モジュールである。オーディオブック再生モジュール322によるオーディオブックの再生には、元の(編集前の)音声の再生と編集済みのオーディオブックの再生とがある。オーディオブック再生モジュール322は、再生手段の一例である。
【0026】
オーディオブック編集モジュール323は、オーディオブックを編集するモジュールである。オーディオブックの編集は、登場人物の台詞やナレーションの音声を、ユーザが録音した音声に置き換えることにより行われる。ユーザの音声は、例えば、端末30のマイク306(
図2参照)を用いて収録される。なお、オーディオブックの編集対象には、台詞やナレーション以外の音声を含んでも良い。例えば、BGM(background music)や効果音を他の音に置き換える編集を可能としても良い。また、オーディオブック編集モジュール323による音声の置き換えは、一つのオーディオブック全体に対して行うだけでなく、オーディオブックを分割した部分ごとに行うことができる。例えば、特定の登場人物の台詞のみを置き換えたり、特定の場面の音声のみを置き換えたりしても良い。オーディオブック編集モジュール323は、編集手段の一例である。
【0027】
オーディオブックの編集は、編集対象のオーディオブックのファイルに対して行われるのではなく、かかるファイルの複製に対して行われる。したがって、オーディオブックの編集が行われると、元の(編集前の)オーディオブックのファイルとは別に、編集された(編集後の)オーディオブックのファイルができる。以下、編集されたオーディオブックのファイルを、編集済みオーディオブックと呼ぶ。編集済みオーディオブックは、編集が行われた音声情報ファイルの一例である。編集対象のオーディオブックは、初期的には、オーディオブック取得モジュール321により取得されたオーディオブックのファイルである。そして、オーディオブックの編集が行われた後は、編集済みオーディオブックも編集対象として、さらに編集を行うことができる。
【0028】
編集済みオーディオブック保存モジュール324は、端末30の記憶ユニット302(
図2参照)等の記憶手段に編集済みオーディオブックを保存するモジュールである。上述したように、編集済みオーディオブックは、元のオーディオブックとは別ファイルとして生成されるため、編集済みオーディオブック保存モジュール324は、元のオーディオブックとは別個に編集済みオーディオブックを保存する。保存される編集済みオーディオブックのファイルには、ファイル名またはヘッダ等に記録されるメタ情報として、編集日時(または保存日時)が記録される。編集済みオーディオブック保存モジュール324は、保存手段の一例である。
【0029】
また、編集済みオーディオブック保存モジュール324は、保存した編集済みオーディオブックの編集情報を作成する。編集情報には、例えば、置き換えられた音声を発声したユーザ(以下、発声主体と呼ぶ)、発声主体であるユーザの年齢、編集日時(または保存日時)等の情報が含まれる。なお、編集情報は、編集済みオーディオブック保存モジュール324が編集済みオーディオブックを保存した際に自動的に生成されるが、事後的に編集可能としても良い。編集情報は、該当する編集済みオーディオブックに対応付けられ、例えば管理テーブルに登録して管理される。編集情報に対応付けられた編集済みオーディオブックは、例えば、子供の成長の履歴として残すことが可能になる。
【0030】
提示画面表示制御モジュール325は、編集済みオーディオブックの提示画面を生成し、端末30の表示ユニット303(
図2参照)等の表示手段に表示させるモジュールである。提示画面は、例えば、編集済みオーディオブックの編集情報を、各編集済みオーディオブックの生成時期順に並べた一覧である。また、提示画面は、ユーザの操作を受け付けるユーザインタフェース画面としての機能を有しても良い。例えば、ユーザが表示ユニット303に表示された提示画面上で所望の編集済みオーディオブックを指定する操作を行うと、指定された編集済みオーディオブックが再生されるようにしても良い。提示画面を用いたユーザインタフェースについては、具体例を後述する。提示画面表示制御モジュール325は、提示手段の一例である。
【0031】
再生制御モジュール326は、ユーザによる再生指示を受け付けて、選択された編集済みオーディオブックの再生を制御するモジュールである。再生制御モジュール326は、再生指示に応じて、オーディオブックのコンテンツにおける場面ごとや台詞ごとに再生することができる。これにより、例えば、特定の場面における特定の登場人物の台詞のみを再生することもできる。再生制御モジュール326は、再生制御手段の一例である。
【0032】
また、同じオーディオブックや同じ場面に対して音声の置き換えが行われた複数の編集済みオーディオブックが存在する場合、場面や台詞ごとに異なる編集済みオーディオブックの該当箇所の音声を組み合わせて再生しても良い。この場合、再生する編集済みオーディオブックは、場面や台詞等の部分ごとにユーザが設定しても良いし、適当な規則に基づいて自動的に設定しても良い。後者の場合、例えば、編集時期や保存時期の古いファイルから生成順に、部分ごとの音声を割り当てて再生しても良い。このようにすると、置き換えられた音声を発声したユーザが同一人物である場合、編集済みオーディオブックの部分ごとに、その人物の声が若いころから順に(すなわち、年齢順に)用いられて再生される。編集時期の異なる複数の編集済みオーディオブックから音声を抽出して再生を行った場合、編集済みオーディオブック保存モジュール324により、かかる複数の編集済みオーディオブックの音声が組み合わされた新たな編集済みオーディオブックのファイルとして保存しても良い。
【0033】
<オーディオファイル管理サーバ20のハードウェア構成>
図4は、オーディオファイル管理サーバ20の構成例を示す図である。オーディオファイル管理サーバ20は、コンピュータにより実現され、演算手段であるCPU201と、記憶手段であるROM203、RAM202、記憶装置204とを備える。RAM202は、主記憶装置(メイン・メモリ)であり、CPU201が演算処理を行う際の作業用メモリとして用いられる。ROM203にはプログラムや予め用意された設定値等のデータが保持されており、CPU201はROM203から直接プログラムやデータを読み込んで処理を実行することができる。記憶装置204は、プログラムやデータの保存手段である。記憶装置204にはプログラムが記憶されており、CPU201は記憶装置204に格納されたプログラムを主記憶装置に読み込んで実行する。また、記憶装置204には、CPU201による処理の結果が格納され、保存される。記憶装置204としては、例えば磁気ディスク装置やSSD等が用いられる。
【0034】
オーディオファイル管理サーバ20が上記のコンピュータにより構成される場合、例えば、CPU201がプログラムを実行することにより、以下に説明するこれらのサーバの各機能が実現される。オーディオファイル管理サーバ20は、例えば、ネットワーク上に構築されたサーバとして実現される。なお、これらのサーバは、単一のハードウェア(サーバマシン等)による構成に限定されず、複数のハードウェアや仮想マシンに分散して構成しても良い。
【0035】
<オーディオファイル管理サーバ20の機能>
図5は、オーディオファイル管理サーバ20の機能構成を示す図である。オーディオファイル管理サーバ20は、オーディオファイル管理部210と、オーディオファイル格納部220と、提示画面生成部230とを備える。
【0036】
オーディオファイル管理部210は、元のオーディオブックと共に、端末30で編集(台詞音声等の置き換え)された編集済みオーディオブックおよび編集情報を取得し、管理する。端末30から取得した編集済みオーディオブックは、オーディオファイル格納部220に格納される。
【0037】
オーディオファイル格納部220は、オーディオブックを格納し保存する。オーディオファイル格納部220には、元のオーディオブックと、編集済みオーディオブックとが格納される。上述したように、端末30には編集済みオーディオブック保存モジュール324が設けられており、生成した編集済みオーディオブックを保存可能であるが、記憶ユニット302の記憶容量が不足した場合には、外部記憶手段としてのオーディオファイル格納部220に保存することができる。また、端末30で生成した編集済みオーディオブックをオーディオファイル管理サーバ20のオーディオファイル格納部220にバックアップしておくことにより、端末30の機器(ハードウェア)を変更した場合に、それまでに生成した編集済みオーディオブックを引き継ぐことができる。
【0038】
提示画面生成部230は、端末30からの要求に応じて、編集済みオーディオブックの提示画面を生成し、返送する。端末30において編集済みオーディオブックを再生する場合、提示画面表示制御モジュール325により、編集済みオーディオブックを提示して再生対象の選択を受け付けるための提示画面が生成される。ここで、編集済みオーディオブックおよび編集情報がオーディオファイル管理部210に管理されている場合、提示画面表示制御モジュール325に代わって、オーディオファイル管理サーバ20の提示画面生成部230が提示画面を生成しても良い。このようにすれば、編集済みオーディオブックおよび編集情報をバックアップした後、これらのデータを端末30において削除した場合であっても、端末30において、オーディオファイル管理サーバ20から提示画面を取得して表示することができる。
【0039】
<編集済みオーディオブックの再生動作>
次に、編集済みオーディオブックの再生動作について説明する。なお、ここでは、端末30が、編集済みオーディオブック保存モジュール324により自装置に編集済みオーディオブックを保持し、提示画面表示制御モジュール325により提示画面を生成するものとする。
【0040】
図6は、端末30による編集済みオーディオブックの再生動作を示すフローチャートである。初期状態として、端末30の表示ユニット303に機能選択のメニュー画面が表示されているものとする。特に図示しないが、メニュー画面は、オーディオブックのコンテンツの選択や再生、属性の設定等の機能がメニュー表示され、ユーザが画面上の操作により選択するように構成されている。ユーザは、このメニュー画面が表示された状態で操作受付ユニット304に対する操作を行い、所望の機能を選択する(S601)。
【0041】
メニュー画面において、オーディオブックの再生が選択されると、提示画面表示制御モジュール325によりオーディオブックの提示画面が表示され、端末30の表示ユニット303に表示される。提示画面330には、オーディオブックのコンテンツごとに、元のオーディオブックと編集済みオーディオブックとが表示される。
【0042】
図7は、提示画面の例を示す図である。
図7に示す例において、提示画面330には、ファイル情報表示領域331と、ボタンオブジェクト332とが設けられている。ファイル情報表示領域331には、元のオーディオブックおよび編集済みオーディオブック保存モジュール324により保存されている編集済みオーディオブックのファイルの一覧が表示される。
図7に示す例では、オーディオブックのコンテンツ「昔話1」および「昔話2」に関して、それぞれ複数のオーディオブックのファイルが示されている。なお、
図7では、元のオーディオブックと編集済みオーディオブックとを明示的に区別して表示していないが、各コンテンツの最上位には元のオーディオブックを表示したり、元のオーディオブックであることを示す表示を付したりすることにより区別しても良い。
【0043】
各ファイルについては、「タイトル」、「名前」、「年齢」、「録音年月日」の各項目の情報が示されている。「タイトル」は、オーディオブックのコンテンツのタイトルを示す。「名前」は、編集済みオーディオブックにおいて、音声の置き換えに係る発声主体であるユーザの名前を示す。「年齢」は、発声主体であるユーザの年齢を示す。「録音年月日」は、編集済みオーディオブックの編集が行われた時期を示す。これらの情報は、各ファイルに対応付けられた編集情報から得られる。これらの情報により、ユーザは、編集済みオーディオブックに関して、誰が、いつ(何歳の時に)編集したファイルかを特定することができる。提示画面440はユーザインタフェース画面を兼ねており、ユーザは、ファイル情報表示領域331の表示上で所望のファイルが表示された欄を指定する操作(マウスクリック等)を行い、再生対象を特定する。「決定」と記されたボタンオブジェクト332は、再生対象のファイルを確定するためのオブジェクトである。「場面を指定」と記されたボタンオブジェクト333は、編集済みオーディオブックのコンテンツの部分である場面のうち、再生する場面を選択する選択画面に移行するためのオブジェクトである。
【0044】
図8は、選択画面の例を示す図である。
図8に示す例において、選択画面340には、場面特定表示341と、編集情報表示領域342と、ボタンオブジェクト343とが設けられている。選択画面340は、ユーザインタフェース画面を兼ねている。場面特定表示341は、物語を複数の場面に分け、各場面を時系列にしたがって並べた帯領域である。ユーザがこの場面特定表示341上の所望の場面を指定すると、その場面に対する編集が行われていれば、編集情報表示領域342が表示され、該当箇所の編集情報が表示される。
図8に示す例では、場面特定表示341の左端(物語の最初の場面)から右方向へ向かって3番目の場面)が指定されており、指定された場面の位置からプルダウン表示により編集情報表示領域342が表示されている。
【0045】
編集情報表示領域342には、指定された場面に関して、音声の置き換えに係る発声主体であるユーザの「名前」、発声主体であるユーザの「年齢」、編集済みオーディオブックの編集が行われた時期を示す「録音年月日」の各情報が示されている。ユーザは、編集情報表示領域342の表示上で所望の編集情報が表示された欄を指定する操作(マウスクリック等)を行い、指定された場面における再生対象の音声(データ)を特定する。「決定」と記されたボタンオブジェクト343は、場面特定表示341への操作で特定された場面に対する再生対象の音声を確定するためのオブジェクトである。
図8に示す例では、一か所の場面のみが指定されているが、各場面に対して、再生対象の音声をそれぞれ指定することができる。
【0046】
図6に戻り、提示画面330(
図7参照)において一の編集済みオーディオブック(図では「編集済みファイル」と記載)が指定され(S602でYES)、選択画面340(
図8参照)において再生箇所(場面)および音声が指定されて(S603でYES)、「決定」のボタンオブジェクト343が操作されると、再生制御モジュール326が、編集済みオーディオブックにおける再生箇所での再生対象の音声の指定を受け付け(S604)、該当箇所の音声の再生指示をオーディオブック再生モジュール322に対して送信する。
【0047】
一方、提示画面330(
図7参照)において一の編集済みオーディオブックが指定された後(S602でYES)、選択画面340での再生箇所の指定が行われずに(S603でNO)、「決定」のボタンオブジェクト332が操作されると、再生制御モジュール326が、編集済みオーディオブックのファイルの指定を受け付け(S605)、該当する編集済みオーディオブックの再生指示をオーディオブック再生モジュール322に対して送信する。
【0048】
また、提示画面330(
図7参照)において編集済みオーディオブックが指定されずに元のオーディオブックが指定されて(S602でNO)、「決定」のボタンオブジェクト332が操作されると、再生制御モジュール326が、元のオーディオブックの再生指示をオーディオブック再生モジュール322に対して送信する。
【0049】
オーディオブック再生モジュール322は、再生制御モジュール326から送信されたこれらの再生指示を受け付けると(S606)、受け付けた再生指示にしたがってオーディオブックの再生を開始する(S607)。
【0050】
なお、上記の動作例では、編集済みオーディオブックの部分として場面に着目し、場面ごとに再生対象の音声を選択し得るとしたが、さらに、登場人物やナレーション等のコンテンツ中の発話者別に再生音声を選択可能としても良い。上記の動作や画面の構成は例示に過ぎず、再生しようとするオーディオブックのコンテンツに編集済みオーディオブックが存在する場合に、特定のファイルやかかるファイルの特定の部分を再生対象として指定し、再生可能とするものであれば良い。
【0051】
以上、本発明の実施形態について説明したが、本発明の技術的範囲は上記実施形態には限定されない。例えば、上記の実施形態では、オーディオファイル管理サーバ20が、オーディオファイル管理部210、オーディオファイル格納部220および提示画面生成部230とを備える構成としたが、元のオーディオブックを管理するオーディオファイル管理サーバ20とは別の外部サーバとして、編集済みオーディオブックを管理するサーバを設けても良い。また、上記の実施形態では、編集済みオーディオブックおよび編集情報を共に、オーディオファイル管理サーバ20に保存したが、データサイズの大きい編集済みオーディオブックのみをサーバに保存させ、編集情報は端末30のみで保持しても良い。その他、本発明の技術思想の範囲から逸脱しない様々な変更や構成の代替は、本発明に含まれる。
【符号の説明】
【0052】
1…ネットワークシステム、10…インターネット、20…オーディオファイル管理サーバ、30…端末、301…制御ユニット、321…オーディオブック取得モジュール、322…オーディオブック再生モジュール、323…オーディオブック編集モジュール、324…編集済みオーディオブック保存モジュール、325…提示画面表示制御モジュール、326…再生制御モジュール