特許第6185712号(P6185712)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特許6185712音声合成用読み上げテキストデータ選択装置およびそのプログラム
<>
  • 特許6185712-音声合成用読み上げテキストデータ選択装置およびそのプログラム 図000002
  • 特許6185712-音声合成用読み上げテキストデータ選択装置およびそのプログラム 図000003
  • 特許6185712-音声合成用読み上げテキストデータ選択装置およびそのプログラム 図000004
  • 特許6185712-音声合成用読み上げテキストデータ選択装置およびそのプログラム 図000005
  • 特許6185712-音声合成用読み上げテキストデータ選択装置およびそのプログラム 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6185712
(24)【登録日】2017年8月4日
(45)【発行日】2017年8月23日
(54)【発明の名称】音声合成用読み上げテキストデータ選択装置およびそのプログラム
(51)【国際特許分類】
   G10L 13/06 20130101AFI20170814BHJP
【FI】
   G10L13/06 230Z
   G10L13/06 210Z
【請求項の数】2
【全頁数】17
(21)【出願番号】特願2012-261436(P2012-261436)
(22)【出願日】2012年11月29日
(65)【公開番号】特開2014-106479(P2014-106479A)
(43)【公開日】2014年6月9日
【審査請求日】2015年10月1日
【権利譲渡・実施許諾】特許権者において、実施許諾の用意がある。
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】特許業務法人磯野国際特許商標事務所
(74)【代理人】
【識別番号】100064414
【弁理士】
【氏名又は名称】磯野 道造
(74)【代理人】
【識別番号】100111545
【弁理士】
【氏名又は名称】多田 悦夫
(72)【発明者】
【氏名】世木 寛之
(72)【発明者】
【氏名】杉本 岳大
【審査官】 大野 弘
(56)【参考文献】
【文献】 特開2006−030892(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/06
(57)【特許請求の範囲】
【請求項1】
読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置であって、
音声データ単位辞書を記憶する音声データ単位辞書記憶手段と、
前記音声データ単位の目標数を記憶する音声データ単位目標数記憶手段と、
前記音声データ単位辞書を参照して、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位ごとの数を計数し、前記目標数からそれぞれ減算することで、前記音声データ単位ごとの新たな目標数を設定する音声データ単位目標数設定手段と、
前記読み上げテキストデータ候補から、前記音声データ単位が新たな目標数分含むように読み上げテキストデータを選択する読み上げテキストデータ選択手段と、を備え、
前記音声データ単位目標数設定手段は、
前記読み上げ済みテキストデータを順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げ済みテキストデータ分割手段と、
この読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する読み上げ済み音声データ単位計数手段と、
この読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、当初の目標数から減算することで、音声データ単位ごとの新たな目標数を設定する目標数設定手段と、を備え、
前記読み上げテキストデータ選択手段は、
前記読み上げテキストデータ候補を順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割するテキストデータ分割手段と、
このテキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている前記目標数がゼロでない音声データ単位を計数する音声データ単位計数手段と、
計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新するテキストデータ選択手段と、
このテキストデータ選択手段で読み上げテキストデータを選択した際に、前記音声データ単位計数手段で計数された音声データ単位ごとの数を、前記音声データ単位目標数記憶手段に記憶されている当該音声データ単位の目標数から減算する目標数更新手段と、
を備えることを特徴とする音声合成用読み上げテキストデータ選択装置。
【請求項2】
音声データ単位辞書を記憶する音声データ単位辞書記憶手段を備え、読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置のコンピュータを、
前記読み上げ済みテキストデータを順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げ済みテキストデータ分割手段、
この読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する読み上げ済み音声データ単位計数手段、
この読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、当初の目標数から減算することで、音声データ単位ごとの新たな目標数を設定する目標数設定手段、
前記読み上げテキストデータ候補を順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割するテキストデータ分割手段、
このテキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている前記目標数がゼロでない音声データ単位を計数する音声データ単位計数手段、
計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新するテキストデータ選択手段、
このテキストデータ選択手段で読み上げテキストデータを選択した際に、前記音声データ単位計数手段で計数された音声データ単位ごとの数を、当該音声データ単位の目標数から減算する目標数更新手段、
として機能させるための音声合成用読み上げテキストデータ選択プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予め準備したテキストデータから、音声合成に用いる種々の音を読み上げるための音声合成用読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置およびそのプログラムに関する。
【背景技術】
【0002】
従来、音声合成に用いる種々の音(音声データ)を集めた音声合成用データベースを作成する際に、予め準備した膨大なテキストデータから、種々の音を読み上げるためのテキストデータ(読み上げテキストデータ)を選択する方法として、「集合被覆問題における貪欲近似アルゴリズム」(非特許文献1参照)を用いた方法が知られていた。
この方法は、音声データを最も多く含む読み上げテキストデータを見つけるために、1つの読み上げテキストデータを選択するたびに、音声データ数の再計算およびソート処理をしなければならず、処理時間がかかるとともに、膨大なメモリを使用するという問題があった。
そこで、この問題を解決するために、本出願の発明者らは、読み上げテキストデータの候補を入力するたびに、音声合成の単位である音声データ単位の数が最大値となった読み上げテキストデータを、メモリに保持せずに逐次選択していく方法を提案した(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第4741208号公報
【非特許文献】
【0004】
【非特許文献1】T.コルメン他著、“アルゴリズムイントロダクション”、第3巻、近代科学社、1995年12月30日、p313−317
【発明の概要】
【発明が解決しようとする課題】
【0005】
この特許文献1における方法は、非特許文献1の「集合被覆問題における貪欲近似アルゴリズム」よりも、演算に要する処理時間と使用メモリ量とを大きく削減することができる優れた効果を有するものである。
しかし、この方法(「集合被覆問題における貪欲近似アルゴリズム」も同様)において、新たなテキストデータから、足りない音声データ単位を含んだ読み上げテキストデータのみを選択したい場合であっても、過去に選択した読み上げテキストデータを考慮していないため、音声データ単位に対して、同じような読み上げ箇所を含んだ読み上げテキストデータが重複して選択される場合がある。
また、逆に、過去に選択した読み上げテキストデータと、新たなテキストデータとから、新たな音声データ単位を含んだ読み上げテキストデータを選択すると、読み上げテキストデータ全体を選択し直すことになる。
【0006】
このように、音声データ単位が必要以上に重複した読み上げテキストデータを選択したり、読み上げテキストデータ全体を選択し直したりした場合、音声合成用の音声を収録する際の時間が増加し、読み上げテキストデータを読み上げる話者(アナウンサ)の拘束時間、スタジオの賃貸料が増加することになる。
そのため、従来の方法に対して、足りない音声データ単位を含んだテキストデータを選択する方法が望まれていた。
【0007】
本発明は、このような要望に鑑みてなされたものであり、すでに読み上げテキストデータとして選択されたテキストデータを考慮して、新たなテキストデータから、足りない音声データ単位を含んだテキストデータのみを読み上げテキストデータとして選択することが可能な音声合成用読み上げテキストデータ選択装置およびそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0008】
前記課題を解決するため、請求項1に記載の音声合成用読み上げテキストデータ選択装置は、読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置であって、音声データ単位辞書記憶手段と、音声データ単位目標数記憶手段と、音声データ単位目標数設定手段と、読み上げテキストデータ選択手段と、を備え、音声データ単位目標数設定手段が、読み上げ済みテキストデータ分割手段と、読み上げ済み音声データ単位計数手段と、目標数設定手段と、を備え、読み上げテキストデータ選択手段が、テキストデータ分割手段と、音声データ単位計数手段と、テキストデータ選択手段と、目標数更新手段と、を備える構成とした。
【0009】
かかる構成において、音声合成用読み上げテキストデータ選択装置は、音声データ単位目標数設定手段によって、音声データ単位辞書記憶手段に記憶されている音声データ単位辞書を参照して、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位ごとの数を計数し、当初の目標数からそれぞれ減算することで、音声データ単位目標数記憶手段において、音声データ単位ごとの新たな目標数を設定する。
すなわち、音声合成用読み上げテキストデータ選択装置は、読み上げ済みテキストデータ分割手段によって、読み上げ済みテキストデータを順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。
そして、音声合成用読み上げテキストデータ選択装置は、読み上げ済み音声データ単位計数手段によって、読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する。これによって、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位が計数される。
そして、音声合成用読み上げテキストデータ選択装置は、目標数設定手段によって、読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、音声データ単位目標数記憶手段において、当初の目標数から減算する。これによって、当初の目標数に対して足りない音声声データ単位ごとの新たな目標数が設定されることになる。
【0010】
そして、音声合成用読み上げテキストデータ選択装置は、読み上げテキストデータ選択手段によって、読み上げテキストデータ候補から、音声データ単位が新たな目標数分含むように読み上げテキストデータを選択する。
すなわち、音声合成用読み上げテキストデータ選択装置は、テキストデータ分割手段によって、読み上げテキストデータ候補を順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。そして、音声合成用読み上げテキストデータ選択装置は、音声データ単位計数手段によって、テキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている目標数がゼロでない音声データ単位を計数する。
これによって、音声合成用読み上げテキストデータ選択装置は、読み上げテキストデータとして選択されたテキストデータにおいて、まだ、当初の目標数分含まれていない音声データ単位のみを計数する。
【0011】
そして、音声合成用読み上げテキストデータ選択装置は、テキストデータ選択手段によって、音声データ単位計数手段で計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新する。
すなわち、テキストデータ選択手段は、繰り返し処理において、その時点で、より多くの音声データ単位を含んだ読み上げテキストデータ候補を読み上げテキストデータとして選択する。これによって、繰り返し処理の時間を短縮することができる。
【0012】
そして、音声合成用読み上げテキストデータ選択装置は、目標数更新手段によって、テキストデータ選択手段で読み上げテキストデータを選択した際に、音声データ単位計数手段で計数された音声データ単位ごとの数を、音声データ単位目標数記憶手段に記憶されている当該音声データ単位の目標数から減算する。
これによって、選択された読み上げテキストデータに含まれている音声データ単位の数が、目標数から減算され、必要以上に音声データ単位を含んだ読み上げテキストデータを選択することを防止することができる。
【0016】
また、請求項に記載の音声合成用読み上げテキストデータ選択プログラムは、音声データ単位辞書を記憶する音声データ単位辞書記憶手段を備え、読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置のコンピュータを、読み上げ済みテキストデータ分割手段、読み上げ済み音声データ単位計数手段、目標数設定手段、テキストデータ分割手段、音声データ単位計数手段、テキストデータ選択手段、目標数更新手段、として機能させることを特徴とする。
【0017】
かかる構成において、音声合成用読み上げテキストデータ選択プログラムは、読み上げ済みテキストデータ分割手段によって、読み上げ済みテキストデータを順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。
そして、音声合成用読み上げテキストデータ選択プログラムは、読み上げ済み音声データ単位計数手段によって、読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する。
そして、音声合成用読み上げテキストデータ選択プログラムは、目標数設定手段によって、読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、当初の目標数から減算することで、音声データ単位ごとの新たな目標数を設定する
【0018】
そして、音声合成用読み上げテキストデータ選択プログラムは、テキストデータ分割手段によって、読み上げテキストデータ候補を順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。
そして、音声合成用読み上げテキストデータ選択プログラムは、音声データ単位計数手段によって、テキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている目標数がゼロでない音声データ単位を計数する。
【0019】
そして、音声合成用読み上げテキストデータ選択プログラムは、テキストデータ選択手段によって、音声データ単位計数手段で計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新する。
そして、音声合成用読み上げテキストデータ選択プログラムは、目標数更新手段によって、テキストデータ選択手段で読み上げテキストデータを選択した際に、音声データ単位計数手段で計数された音声データ単位ごとの数を、当該音声データ単位の目標数から減算する。
【発明の効果】
【0020】
本発明は、以下に示す優れた効果を奏するものである。
請求項1,に記載の発明によれば、過去に読み上げテキストデータとして選択されている読み上げ済みテキストデータに含まれている音声データ単位の数を削減して、読み上げテキストデータ候補から、目標数の音声データ単位を含むようにテキストデータを選択するため、足りない音声データ単位を含んだテキストデータのみを読み上げテキストデータとして選択することができる。これによって、音声合成用データベースを生成する場合に、アナウンサが読み上げるテキストデータを少なくすることができる。
【0021】
また、請求項1,2に記載の発明によれば、過去に読み上げテキストデータとして選択されている読み上げ済みテキストデータに含まれている音声データ単位の数を計数し、音声データ単位の不足分となる目標数を正しく設定することができる。これによって、足りない音声データ単位を含んだテキストデータのみを効率よく読み上げテキストデータとして選択することができる。
【図面の簡単な説明】
【0022】
図1】本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置の構成を示すブロック構成図である。
図2】本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置の動作を示すフローチャートであって、主に、音声データ単位目標数設定動作を示す。
図3】本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置の動作を示すフローチャートであって、主に、読み上げテキストデータ選択動作を示す。
図4図1の音声データ単位目標数設定手段の動作の一例を説明するための説明図である。
図5図1の読み上げテキストデータ選択手段の動作の一例を説明するための説明図である。
【発明を実施するための形態】
【0023】
以下、本発明の実施形態について図面を参照して説明する。
〔本発明の概要〕
図1に示す本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置1(以下、単にテキストデータ選択装置という)は、音声合成に用いる種々の音(音声データ)を集めた音声合成用データベースを作成する際に、予め準備したテキストデータから、種々の音を読み上げるためのテキストデータ(読み上げテキストデータ)を選択するものである。ただし、本発明は、過去に選択されている読み上げテキストデータとの間で音声データが予め定めた数以上重複しないように、新たな読み上げテキストデータを選択することを特徴とする。
【0024】
例えば、政治や経済のニュース原稿(テキストデータ)から選択された読み上げテキストデータをアナウンサが読み上げることで生成された音声合成用データベースを用いて、音声合成を行った場合、政治や経済のニュースに関する音声合成については、自然な音声として合成可能である。しかし、その音声合成用データベースを用いて、スポーツニュースに関する音声合成を行った場合、不自然な音声となることがある。
【0025】
その場合、テキストデータ選択装置1は、音声合成用データベースに登録されている音声データの元となった、過去に選択された読み上げテキストデータとはなるべく重複しないように、スポーツのニュース原稿から、新たな読み上げテキストデータを選択する。
これによって、アナウンサは、過去に選択されて読み上げたテキストデータを再度読み上げる必要はなく、新たに選択されたテキストデータだけを読み上げるだけでよいため、音声合成用データベースを生成する際の音声収録を行う時間や手間を省くことができる。
【0026】
〔音声合成用読み上げテキストデータ選択装置の構成〕
次に、図1を参照して、本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置(テキストデータ選択装置)1の構成について説明する。
図1に示すように、テキストデータ選択装置1は、音声データ単位辞書記憶手段10と、音声データ単位目標数記憶手段20と、音声データ単位目標数設定手段30と、読み上げテキストデータ選択手段40と、を備える。
なお、テキストデータ選択装置1に入力される読み上げ済みテキストデータは、過去に読み上げテキストデータとして選択されたテキストデータである。また、読み上げテキストデータ候補は、新たに読み上げるテキストデータの候補となるテキストデータである。
【0027】
音声データ単位辞書記憶手段10は、音声合成を行う際の音声データの単位(音声データ単位)をテキストデータとして羅列した音声データ単位辞書を記憶するものであって、ハードディスク等の一般的な記憶媒体である。この音声データ単位は、音声合成の合成単位であって、例えば、単語、文、音素等である。
なお、音声データ単位辞書記憶手段10に新たに音声データ単位を追加する場合、図示を省略した入力手段を介して、書き込むこととする。
この音声データ単位辞書記憶手段10に記憶されている音声データ単位は、音声データ単位目標数設定手段30および読み上げテキストデータ選択手段40によって参照され、テキストデータを分割する際の分割単位として利用される。
【0028】
音声データ単位目標数記憶手段20は、読み上げテキストデータに含ませたい音声データ単位の目標数を記憶するものであって、半導体メモリ等の一般的な記憶媒体である。この音声データ単位目標数は、読み上げテキストデータとして選択するテキストデータのすべてにおいて、個々の音声データ単位を少なくともどれだけ含ませるのかを予め定めた数である。
【0029】
この読み上げテキストデータは、アナウンサ等によって読み上げられることで、音声合成用データベースとして構築されるため、音声データ単位目標数が多いと、それだけ、アナウンサにかかる負荷が増加することになる。
そのため、この音声データ単位目標数の初期値は、音声合成の精度と、テキストデータの読み上げ時間とを考慮して、予め定めておく数であって、“1”以上の任意の数である。
【0030】
この音声データ単位目標数記憶手段20に記憶される音声データ単位目標数は、予め初期値を記憶しておくが、音声データ単位目標数設定手段30によって、読み上げテキストデータ候補から、テキストデータを選択する際の音声データ単位目標数が再設定される。
また、音声データ単位目標数記憶手段20は、読み上げテキストデータ選択手段40によって参照され、音声データ単位が音声データ単位目標数分含まれるように、読み上げテキストデータ候補から、テキストデータが選択される。
【0031】
音声データ単位目標数設定手段30は、音声データ単位目標数記憶手段20に記憶される音声データ単位目標数を設定(再設定)するものである。この音声データ単位目標数設定手段30は、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位の数だけ初期値から減算した値を新たな音声データ単位目標数として設定する。
ここでは、音声データ単位目標数設定手段30は、テキストデータ入力手段31と、テキストデータ分割手段32と、音声データ単位計数手段33と、目標数設定手段34と、を備える。
【0032】
テキストデータ入力手段(読み上げ済みテキストデータ入力手段)31は、外部から、すでに過去に選択された複数のテキストデータ(読み上げ済みテキストデータ)を入力するものである。この読み上げ済みテキストデータは、例えば、音声合成用読み上げテキストデータ選択装置1によって過去に選択されたテキストデータを用いてもよい。あるいは、特許第4741208号公報に記載されている音声合成用読み上げテキストデータ選択装置によって過去に選択されたテキストデータを用いてもよい。
このテキストデータ入力手段31は、入力した読み上げ済みテキストデータを、テキストデータ分割手段32に出力する。
【0033】
テキストデータ分割手段(読み上げ済みテキストデータ分割手段)32は、テキストデータ入力手段31で入力された読み上げ済みテキストデータを、音声データ単位辞書記憶手段10に記憶されている音声データ単位ごとに分割するものである。この音声データ単位ごとに分割する手法は、例えば、特許第4460242号の手法等を用いることができる。これ以外にも、例えば、数字の音声合成の場合、音声データ単位辞書記憶手段10に記憶する音声データ単位を各桁で構成し、テキストデータ分割手段32は、桁ごとに分割することも可能である。この場合、図4に示すように、「二十七」は、「二十」と「七」とに分割される。
また、例えば、音声データ単位辞書記憶手段10に記憶する音声データ単位を音素で構成する場合、テキストデータ分割手段32は、テキストデータを形態素解析し、音素に分割することとする。
このテキストデータ分割手段32は、音声データ単位に分割したテキストデータを、音声データ単位計数手段33に出力する。
【0034】
音声データ単位計数手段(読み上げ済み音声データ単位計数手段)33は、テキストデータ分割手段32で分割されたテキストデータを音声データ単位ごとにカウント(計数)するものである。これによって、読み上げ済みテキストデータに含まれている音声データ単位の数がカウントされることになる。
この音声データ単位計数手段33は、音声データ単位ごとのカウント数を目標数設定手段34に出力する。
【0035】
目標数設定手段34は、音声データ単位目標数記憶手段20に記憶されている音声データ単位の数の予め設定された初期値(初期目標数)から、音声データ単位計数手段33でカウントされた音声データ単位ごとのカウント数を減算して、音声データ単位ごとに、読み上げテキストデータに含ませたい音声データ単位の目標数を設定するものである。
【0036】
すなわち、すでに読み上げ済みテキストデータに含まれており、初期目標数より多くの音声データ単位を含むテキストデータを選択することを避けるため、目標数設定手段34は、音声データ単位計数手段33でカウントされた読み上げ済みテキストデータに含まれている音声データ単位の数を、初期目標数から減算することで、音声データ単位の目標数を新たに設定する。
これによって、音声データ単位目標数設定手段30は、読み上げ済みテキストデータに含まれている音声データ単位の数を、予め定めた数(初期目標数)から減算して、読み上げテキストデータ選択手段40が読み上げテキストデータを選択する際の音声データ単位の目標数を設定することができる。
【0037】
読み上げテキストデータ選択手段40は、音声データ単位辞書記憶手段10に記憶されている音声データ単位が、音声データ単位目標数記憶手段20に記憶されている目標数分含まれるように、読み上げテキストデータ候補の中からテキストデータを選択するものである。
【0038】
ここでは、読み上げテキストデータ選択手段40は、テキストデータ入力手段41と、テキストデータ分割手段42と、音声データ単位計数手段43と、テキストデータ選択手段44と、目標数更新手段45と、テキストデータ出力手段46と、を備える。
【0039】
テキストデータ入力手段(読み上げテキストデータ候補入力手段)41は、外部から、複数の読み上げテキストデータの候補(読み上げテキストデータ候補)を順次入力するものである。この読み上げテキストデータ候補は、音声データ単位辞書記憶手段10に新たに登録した音声データ単位を含んだ複数のテキストデータである。例えば、音声データ単位として、スポーツ関連の単語を登録した場合、読み上げテキストデータ候補は、過去にスポーツのニュース原稿として用いた複数のテキストデータを用いることができる。
このテキストデータ入力手段41は、入力した読み上げテキストデータ候補を、テキストデータ分割手段42およびテキストデータ選択手段44に出力する。
なお、テキストデータ入力手段41は、テキストデータ選択手段44から、読み上げテキストデータ候補の選択判定の完了が通知された段階で、次の読み上げテキストデータ候補を入力し、テキストデータ分割手段42およびテキストデータ選択手段44に出力することとする。
【0040】
テキストデータ分割手段(読み上げテキストデータ候補分割手段)42は、テキストデータ入力手段41で入力された読み上げテキストデータ候補を、音声データ単位辞書記憶手段10に記憶されている音声データ単位ごとに分割するものである。
なお、テキストデータ分割手段42は、テキストデータ分割手段32と同様の手法でテキストデータを音声データ単位に分割することができる。
このテキストデータ分割手段42は、読み上げテキストデータ候補ごとに、音声データ単位に分割されたテキストデータを、音声データ単位計数手段43に出力する。
【0041】
音声データ単位計数手段(読み上げ候補音声データ単位計数手段)43は、読み上げテキストデータ候補ごとに、テキストデータ分割手段42で分割された音声データ単位をカウント(計数)するものである。
【0042】
ただし、音声データ単位計数手段43は、音声データ単位目標数記憶手段20に記憶されている音声データ単位目標数が“0”になっている音声データ単位、すなわち、すでに目標数分選択されている音声データ単位については、カウントしないこととする。
これによって、音声データ単位計数手段43は、読み上げテキストデータ候補に含まれている、音声データ単位目標数に達していない音声データ単位の数がカウントされることになる。
この音声データ単位計数手段43は、読み上げテキストデータ候補ごとに、音声データ単位ごとのカウント数を目標数更新手段45に出力し、その総数(カウント総数)を、テキストデータ選択手段44に出力する。
【0043】
テキストデータ選択手段44は、音声データ単位計数手段43でカウントされた読み上げテキストデータ候補の音声データ単位のカウント総数が、それまでにカウントされたカウント総数の最大値(カウント最大値)以上である場合に、当該読み上げテキストデータ候補を、読み上げテキストデータとして選択するものである。
【0044】
なお、テキストデータ選択手段44は、カウント最大値を予め定めた初期値(例えば“0”)に設定しておき、音声データ単位計数手段43でカウントされる音声データ単位のカウント総数がカウント最大値よりも大きくなった場合に、カウント最大値をそのカウント総数で置き換える。
これによって、テキストデータ選択手段44は、順次、読み上げテキストデータ候補を選択する際に、より多くの音声データ単位を含んでいる候補を選択することができる。
【0045】
このテキストデータ選択手段44は、読み上げテキストデータ候補を読み上げテキストデータとして選択した場合、選択した旨を目標数更新手段45に通知するとともに、テキストデータ入力手段41で入力された読み上げテキストデータをテキストデータ出力手段46に出力する。
なお、テキストデータ選択手段44は、読み上げテキストデータ候補の選択判定を完了した後、テキストデータ入力手段41にその旨を通知する。これによって、順次、読み上げテキストデータ候補が入力されて、読み上げテキストデータとして選択されるか否かが判定される。
【0046】
目標数更新手段45は、テキストデータ選択手段44で読み上げテキストデータを選択した際に、音声データ単位目標数を更新するものである。すなわち、目標数更新手段45は、読み上げテキストデータが選択された場合、当該テキストデータに含まれている音声データ単位の数を音声データ単位目標数から減算する。
【0047】
ここでは、目標数更新手段45は、音声データ単位計数手段43でカウントされた音声データ単位ごとのカウント数を、音声データ単位目標数記憶手段20に記憶されている該当する音声データ単位から減算する。
このように、読み上げテキストデータが選択されるたびに、当該テキストデータに含まれている音声データ単位の数だけ、音声データ単位目標数が減算される。
【0048】
テキストデータ出力手段46は、テキストデータ選択手段44で選択された読み上げテキストデータを外部に出力するものである。
このテキストデータ出力手段46は、テキストデータ選択手段44で選択された読み上げテキストデータを逐次出力することとしてもよいし、図示を省略した記憶手段に選択された読み上げテキストデータをすべて蓄積し、外部から出力指示があった段階で出力することとしてもよい。
【0049】
なお、読み上げテキストデータ選択手段40は、すべての読み上げテキストデータ候補を入力し終わっても、音声データ単位目標数記憶手段20に記憶されている音声データ単位目標数がすべて“0“にならなかった場合、音声データ単位計数手段43で増加させたカウント最大値を初期値(“0”)に設定し直して、読み上げテキストデータ候補を最初から入力し直すこととする。
ここで、読み上げ済みテキストデータおよび読み上げテキストデータ候補に、必要な音声データ単位が目標数分含まれていれば、音声データ単位目標数記憶手段20に記憶されている音声データ単位目標数はすべて“0“になる。
【0050】
なお、本発明においては、読み上げ済みテキストデータおよび読み上げテキストデータ候補には、必要な音声データ単位が目標数分含まれていることを前提としている。もし、その前提とならない読み上げ済みテキストデータおよび読み上げテキストデータ候補を対象とするのであれば、それらのテキストデータについて音声データ単位を累計し、目標数分含まれているか否かを判定する判定手段(不図示)を備え、目標数に達していない音声データ単位を表示手段(不図示)に表示することで、操作者に警告することとすればよい。
【0051】
以上説明したようにテキストデータ選択装置1を構成することで、テキストデータ選択装置1は、音声データ単位を追加した分だけ、読み上げテキストデータを追加して選択することができる。これによって、過去に選択された読み上げ済みテキストデータをアナウンサが読み上げる手間を省いて、追加分のテキストデータのみを読み上げるだけで、音声合成用データベースを構築することが可能になる。
なお、テキストデータ選択装置1は、一般的なコンピュータを、前記した各手段として機能させるプログラム(音声合成用読み上げテキストデータ選択プログラム)で動作させることができる。
【0052】
〔音声合成用読み上げテキストデータ選択装置の動作〕
次に、図2図3を参照して、本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置(テキストデータ選択装置)1の動作について説明する。
ここでは、読み上げ済みテキストデータを入力して、音声データ単位目標数を設定する動作(音声データ単位目標数設定動作)と、読み上げテキストデータ候補から音声データ単位目標数の音声データ単位を含んだテキストデータを選択する動作(読み上げテキストデータ選択動作)とに分けて説明する。
【0053】
(音声データ単位目標数設定動作)
最初に、図2を参照(構成については、適宜図1参照)して、テキストデータ選択装置1の音声データ単位目標数設定動作について説明する。
まず、テキストデータ選択装置1は、予め音声データ単位目標数記憶手段20に、読み上げテキストデータに含ませたい音声データ単位の目標数を設定しておく(ステップS1)。
【0054】
そして、テキストデータ選択装置1は、テキストデータ入力手段31によって、外部から、すでに過去に選択された複数のテキストデータ(読み上げ済みテキストデータ)を入力する(ステップS2)。
そして、テキストデータ選択装置1は、テキストデータ分割手段32によって、ステップS2で入力された読み上げ済みテキストデータを、音声データ単位辞書記憶手段10に記憶されている音声データ単位ごとに分割する(ステップS3)。
【0055】
さらに、テキストデータ選択装置1は、音声データ単位計数手段33によって、ステップS3で分割された音声データ単位のテキストデータを音声データ単位ごとにカウント(計数)する(ステップS4)。
このステップS4でカウントされた音声データ単位の数は、読み上げ済みテキストデータに含まれている音声データ単位の数である。
【0056】
そこで、テキストデータ選択装置1は、目標数設定手段34によって、音声データ単位目標数記憶手段20に記憶されている音声データ単位の数の予め設定された初期目標数から、ステップS4でカウントされた音声データ単位ごとのカウント数を減算する(ステップS5)。
ここで、テキストデータ選択装置1は、読み上げ済みテキストデータをすべて入力し終わった場合(ステップS6でYes)、動作を終了し、まだ、読み上げ済みテキストデータが存在する場合(ステップS6でNo)、ステップS2に戻って、動作を継続する。
【0057】
(読み上げテキストデータ選択動作)
次に、図3を参照(構成については、適宜図1参照)して、テキストデータ選択装置1の読み上げテキストデータ選択動作について説明する。
【0058】
図2で説明した音声データ単位目標数設定動作の後、テキストデータ選択装置1は、読み上げテキストデータ選択手段40のテキストデータ選択手段44で使用する、テキストデータ内の音声データ単位のカウント総数の最大値(カウント最大値)を、初期値(“0”)に設定する(ステップS10)。
【0059】
そして、テキストデータ選択装置1は、テキストデータ入力手段41によって、外部から、読み上げテキストデータの候補(読み上げテキストデータ候補)を入力する(ステップS11)。
そして、テキストデータ選択装置1は、テキストデータ分割手段42によって、ステップS11で入力された読み上げテキストデータ候補を、音声データ単位辞書記憶手段10に記憶されている音声データ単位ごとに分割する(ステップS12)。
【0060】
さらに、テキストデータ選択装置1は、音声データ単位計数手段43によって、ステップS12で分割された音声データ単位のテキストデータを音声データ単位ごとにカウント(計数)する(ステップS13)。ただし、音声データ単位計数手段43は、音声データ単位目標数記憶手段20に記憶されている音声データ単位目標数が“0”になっている音声データ単位については、カウントを行わない。
【0061】
そして、テキストデータ選択装置1は、テキストデータ選択手段44によって、ステップS13でカウントされた読み上げテキストデータ候補の音声データ単位のカウント総数(音声データ単位数)が、それまでにカウントされたカウント総数の最大値(カウント最大値)以上であるか否かを判定する(ステップS14)。
【0062】
ここで、音声データ単位数が、カウント最大値以上の場合(ステップS14でYes)、テキストデータ選択装置1は、テキストデータ選択手段44によって、当該読み上げテキストデータ候補を、読み上げテキストデータとして選択し(ステップS15)、カウント最大値を、ステップS13でカウントされた音声データ単位のカウント総数(音声データ単位数)で更新する(ステップS16)。
【0063】
さらに、テキストデータ選択装置1は、目標数更新手段45によって、ステップS13でカウントされた音声データ単位ごとのカウント数を、音声データ単位目標数記憶手段20に記憶されている該当する音声データ単位から減算することで、音声データ単位目標数を更新し(ステップS17)、ステップS18に動作を進める。
一方、ステップS13でカウントされた音声データ単位数が、カウント最大値未満の場合(ステップS14でNo)、テキストデータ選択装置1は、当該読み上げテキストデータ候補を選択せずに、ステップS18に動作を進める。
【0064】
そして、テキストデータ選択装置1は、読み上げテキストデータ候補をすべて入力し終わっていない場合(ステップS18でNo)、ステップS11に戻って、次の読み上げテキストデータ候補に対して前記同様の処理を行う。
一方、テキストデータ選択装置1は、読み上げテキストデータ候補をすべて入力し終わった場合(ステップS18でYes)、さらに、音声データ単位目標数記憶手段20に記憶されている音声データ単位目標数がすべて“0“になったか否かを判定する(ステップS19)。
【0065】
ここで、音声データ単位目標数がすべて“0“になっていない場合(ステップS19でNo)、テキストデータ選択装置1は、ステップS10に戻って、カウント最大値を初期化し、再度、初めから読み上げテキストデータ候補を順次読み込んで、テキストデータを選択する。
一方、音声データ単位目標数がすべて“0“になった場合(ステップS19でYes)、テキストデータ選択装置1は、テキストデータ入力手段41によって、ステップS15で選択されたテキストデータを、読み上げテキストデータとして出力する(ステップS20)。
【0066】
以上の動作によって、テキストデータ選択装置1は、音声データ単位を目標数含んだテキストデータを選択する際に、読み上げ済みテキストデータに含まれている音声データ単位の数を目標数から減算した数を新たな目標数として、読み上げテキストデータを選択するため、追加した音声データ単位に対して、必要なテキストデータのみを選択することができる。
【0067】
〔音声合成用読み上げテキストデータ選択装置の動作の具体例〕
次に、図4図5を参照して、本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置(テキストデータ選択装置)1の動作の具体例について説明する。
ここでは、数値音声合成データベースを生成する際に読み上げる数字をテキストデータとした例で説明する。
なお、ここでは、「一」から「九十九」までの数字のうちで、「十八」および「二十七」がすでに読み上げ済みテキストデータして選択されているものとする。
そして、「十八」および「二十七」を除く「一」から「九十九」までの数字が、「九十九」から「一」の順で読み上げテキストデータ候補として入力されるものとする。
【0068】
(音声データ単位目標数設定動作)
最初に、図4を参照(構成については、適宜図1参照)して、テキストデータ選択装置1の音声データ単位目標数設定動作の具体例について説明する。
図4(a)に示すように、音声データ単位辞書記憶手段10には、予め数字の「一」、「二」、「三」、「四」、「五」、「六」、「七」、「八」、「九」、「十」、「二十」、「三十」、「四十」、「五十」、「六十」、「七十」、「八十」、「九十」を、音声データ単位として記憶しておく。
なお、図示はしていないが、音声データ単位目標数記憶手段20には、読み上げテキストデータとして含ませたい音声データ単位の目標数を“1”に設定しておく。
【0069】
そして、図4(b)に示すように、テキストデータ選択装置1に、読み上げ済みテキストデータとして「十八」および「二十七」が入力された場合、テキストデータ分割手段32によって、音声データ単位辞書記憶手段10に記憶されている音声データ単位で、「十」,「八」と「二十」,「七」とに分割する。
さらに、テキストデータ選択装置1は、音声データ単位計数手段33によって、分割されたそれぞれの音声データ単位の個数をカウントする。この例では、音声データ単位である「十」,「八」,「二十」,「七」のカウント数が“1”とカウントされる。
【0070】
そして、テキストデータ選択装置1は、目標数設定手段34によって、カウントされた読み上げ済みテキストデータに含まれている音声データ単位の数を、音声データ単位目標数設定手段30に記憶されている目標数から減算する。
これによって、図4(c)に示すように、音声データ単位目標数記憶手段20には、音声データ単位「七」,「八」,「十」,「二十」の目標数が“0”に設定される。
このように、音声データ単位目標数記憶手段20には、読み上げテキストデータ候補から読み上げテキストデータを選択する際の基準となる音声データ単位の目標数が設定される。
【0071】
(読み上げテキストデータ選択動作)
次に、図5を参照(構成については、適宜図1参照)して、テキストデータ選択装置1の読み上げテキストデータ選択動作の具体例について説明する。
図5(a)に示すように、テキストデータ選択装置1に、読み上げテキストデータ候補として「九十九」が入力された場合、「九十九」は、テキストデータ分割手段42によって、音声データ単位辞書記憶手段10に記憶されている音声データ単位で、「九十」,「九」に分割される。
【0072】
ここで、音声データ単位計数手段43が音声データ単位数をカウントした結果は、“2”であり、初期値として予め設定されているカウント最大値“0”以上である。そこで、テキストデータ選択手段44は、「九十九」を読み上げテキストデータとして選択し、カウント最大値を、音声データ単位数“2”に更新する。
そして、音声データ単位「九十」,「九」については、読み上げテキストデータに含まれることとなったため、図5(b)に示すように、目標数更新手段45によって、音声データ単位目標数記憶手段20に記憶されている「九十」,「九」の目標数を、カウント数“1”ずつ減算して“0”に更新する。
【0073】
次に、図5(c)の(c−1)に示すように、テキストデータ選択装置1に、読み上げテキストデータ候補として「九十八」が入力された場合、「九十八」は、テキストデータ分割手段42によって、音声データ単位辞書記憶手段10に記憶されている音声データ単位で、「九十」,「八」に分割される。
【0074】
ここで、音声データ単位「九十」,「八」は、図5(b)に示すように、目標数が“0”となっている。そこで、音声データ単位計数手段43において、目標数が“0”でない音声データ単位数をカウントした結果は“0”となり、カウント最大値“2”未満となる。この場合、テキストデータ選択手段44は、「九十八」を読み上げテキストデータとして選択しない。
同様に、「九十七」,「九十六」,…,「八十七」の読み上げテキストデータ候補についても、音声データ単位計数手段43において、目標数が“0”でない音声データ単位数がカウント最大値“2”以上とならないため、選択されない。
【0075】
次に、図5(c)の(c−2)に示すように、テキストデータ選択装置1に、読み上げテキストデータ候補として「八十六」が入力された場合、「八十六」は、テキストデータ分割手段42によって、音声データ単位辞書記憶手段10に記憶されている音声データ単位で、「八十」,「六」に分割される。
【0076】
ここで、音声データ単位「八十」,「六」は、図5(b)に示すように、目標数が“0”ではない。そこで、音声データ単位計数手段43において、目標数が“0”でない音声データ単位数をカウントした結果は“2”となり、カウント最大値“2”以上となる。
この場合、テキストデータ選択手段44は、「八十六」を読み上げテキストデータとして選択する。なお、このとき、カウント最大値は、音声データ単位数と同じ(“2”)であるため更新されない。
【0077】
この後、読み上げテキストデータ候補のうち、「七十五」,「六十四」,「五十三」,「四十二」,「三十一」が読み上げテキストデータとして選択されることになる。また、これによって、音声データ単位目標数記憶手段20に記憶されている音声データ単位の目標数がすべて“0”になるため、テキストデータ選択装置1は、ここで動作を終了する。
ただし、最後の読み上げテキストデータ候補を処理しても目標数がすべて“0”にならない場合は、カウント最大値を“0”にリセットして、最初から読み上げテキストデータ候補を入力し直す。
【0078】
以上説明したテキストデータ選択装置1によれば、これまでに読み上げテキストデータが存在し、すでに読み上げられた音声が存在する場合に、音声合成に足りない音声だけを追加するために必要なテキストデータのみを選択することができる。
これによって、音声合成データベースを生成するために、アナウンサが追加分のテキストデータだけを読み上げればよいため、音声収録を行う時間や手間を省くことができる。
【符号の説明】
【0079】
1 音声合成用読み上げテキストデータ選択装置(テキストデータ選択装置)
10 音声データ単位辞書記憶手段
20 音声データ単位目標数記憶手段
30 音声データ単位目標数設定手段
31 テキストデータ入力手段(読み上げ済みテキストデータ入力手段)
32 テキストデータ分割手段(読み上げ済みテキストデータ分割手段)
33 音声データ単位計数手段(読み上げ済み音声データ単位計数手段)
34 目標数設定手段
40 読み上げテキストデータ選択手段
41 テキストデータ入力手段(読み上げテキストデータ候補入力手段)
42 テキストデータ分割手段(読み上げテキストデータ候補分割手段)
43 音声データ単位計数手段(読み上げ候補音声データ単位計数手段)
44 テキストデータ選択手段
45 目標数更新手段
46 テキストデータ出力手段
図1
図2
図3
図4
図5