特許6185712 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特許6185712音声合成用読み上げテキストデータ選択装置およびそのプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6185712

(24)【登録日】2017年8月4日

(45)【発行日】2017年8月23日

(54)【発明の名称】音声合成用読み上げテキストデータ選択装置およびそのプログラム

(51)【国際特許分類】

G10L 13/06 20130101AFI20170814BHJP

【ＦＩ】

G10L13/06 230Z

G10L13/06 210Z

【請求項の数】2

【全頁数】17

(21)【出願番号】特願2012-261436(P2012-261436)

(22)【出願日】2012年11月29日

(65)【公開番号】特開2014-106479(P2014-106479A)

(43)【公開日】2014年6月9日

【審査請求日】2015年10月1日

【権利譲渡・実施許諾】特許権者において、実施許諾の用意がある。

(73)【特許権者】

【識別番号】000004352

【氏名又は名称】日本放送協会

(74)【代理人】

【識別番号】110001807

【氏名又は名称】特許業務法人磯野国際特許商標事務所

(74)【代理人】

【識別番号】100064414

【弁理士】

【氏名又は名称】磯野道造

(74)【代理人】

【識別番号】100111545

【弁理士】

【氏名又は名称】多田悦夫

(72)【発明者】

【氏名】世木寛之

(72)【発明者】

【氏名】杉本岳大

【審査官】大野弘

(56)【参考文献】

【文献】特開２００６−０３０８９２（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ１３／０６

(57)【特許請求の範囲】

【請求項1】

読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置であって、
音声データ単位辞書を記憶する音声データ単位辞書記憶手段と、
前記音声データ単位の目標数を記憶する音声データ単位目標数記憶手段と、
前記音声データ単位辞書を参照して、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位ごとの数を計数し、前記目標数からそれぞれ減算することで、前記音声データ単位ごとの新たな目標数を設定する音声データ単位目標数設定手段と、
前記読み上げテキストデータ候補から、前記音声データ単位が新たな目標数分含むように読み上げテキストデータを選択する読み上げテキストデータ選択手段と、を備え、
前記音声データ単位目標数設定手段は、
前記読み上げ済みテキストデータを順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げ済みテキストデータ分割手段と、
この読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する読み上げ済み音声データ単位計数手段と、
この読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、当初の目標数から減算することで、音声データ単位ごとの新たな目標数を設定する目標数設定手段と、を備え、
前記読み上げテキストデータ選択手段は、
前記読み上げテキストデータ候補を順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割するテキストデータ分割手段と、
このテキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている前記目標数がゼロでない音声データ単位を計数する音声データ単位計数手段と、
計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新するテキストデータ選択手段と、
このテキストデータ選択手段で読み上げテキストデータを選択した際に、前記音声データ単位計数手段で計数された音声データ単位ごとの数を、前記音声データ単位目標数記憶手段に記憶されている当該音声データ単位の目標数から減算する目標数更新手段と、
を備えることを特徴とする音声合成用読み上げテキストデータ選択装置。

【請求項2】

音声データ単位辞書を記憶する音声データ単位辞書記憶手段を備え、読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置のコンピュータを、
前記読み上げ済みテキストデータを順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割する読み上げ済みテキストデータ分割手段、
この読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する読み上げ済み音声データ単位計数手段、
この読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、当初の目標数から減算することで、音声データ単位ごとの新たな目標数を設定する目標数設定手段、
前記読み上げテキストデータ候補を順次入力し、前記音声データ単位辞書に登録されている音声データ単位に分割するテキストデータ分割手段、
このテキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている前記目標数がゼロでない音声データ単位を計数する音声データ単位計数手段、
計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新するテキストデータ選択手段、
このテキストデータ選択手段で読み上げテキストデータを選択した際に、前記音声データ単位計数手段で計数された音声データ単位ごとの数を、当該音声データ単位の目標数から減算する目標数更新手段、
として機能させるための音声合成用読み上げテキストデータ選択プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、予め準備したテキストデータから、音声合成に用いる種々の音を読み上げるための音声合成用読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置およびそのプログラムに関する。

【背景技術】

【0002】

従来、音声合成に用いる種々の音（音声データ）を集めた音声合成用データベースを作成する際に、予め準備した膨大なテキストデータから、種々の音を読み上げるためのテキストデータ（読み上げテキストデータ）を選択する方法として、「集合被覆問題における貪欲近似アルゴリズム」（非特許文献１参照）を用いた方法が知られていた。
この方法は、音声データを最も多く含む読み上げテキストデータを見つけるために、１つの読み上げテキストデータを選択するたびに、音声データ数の再計算およびソート処理をしなければならず、処理時間がかかるとともに、膨大なメモリを使用するという問題があった。
そこで、この問題を解決するために、本出願の発明者らは、読み上げテキストデータの候補を入力するたびに、音声合成の単位である音声データ単位の数が最大値となった読み上げテキストデータを、メモリに保持せずに逐次選択していく方法を提案した（特許文献１参照）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特許第４７４１２０８号公報

【非特許文献】

【0004】

【非特許文献1】Ｔ．コルメン他著、“アルゴリズムイントロダクション”、第３巻、近代科学社、１９９５年１２月３０日、ｐ３１３−３１７

【発明の概要】

【発明が解決しようとする課題】

【0005】

この特許文献１における方法は、非特許文献１の「集合被覆問題における貪欲近似アルゴリズム」よりも、演算に要する処理時間と使用メモリ量とを大きく削減することができる優れた効果を有するものである。
しかし、この方法（「集合被覆問題における貪欲近似アルゴリズム」も同様）において、新たなテキストデータから、足りない音声データ単位を含んだ読み上げテキストデータのみを選択したい場合であっても、過去に選択した読み上げテキストデータを考慮していないため、音声データ単位に対して、同じような読み上げ箇所を含んだ読み上げテキストデータが重複して選択される場合がある。
また、逆に、過去に選択した読み上げテキストデータと、新たなテキストデータとから、新たな音声データ単位を含んだ読み上げテキストデータを選択すると、読み上げテキストデータ全体を選択し直すことになる。

【0006】

このように、音声データ単位が必要以上に重複した読み上げテキストデータを選択したり、読み上げテキストデータ全体を選択し直したりした場合、音声合成用の音声を収録する際の時間が増加し、読み上げテキストデータを読み上げる話者（アナウンサ）の拘束時間、スタジオの賃貸料が増加することになる。
そのため、従来の方法に対して、足りない音声データ単位を含んだテキストデータを選択する方法が望まれていた。

【0007】

本発明は、このような要望に鑑みてなされたものであり、すでに読み上げテキストデータとして選択されたテキストデータを考慮して、新たなテキストデータから、足りない音声データ単位を含んだテキストデータのみを読み上げテキストデータとして選択することが可能な音声合成用読み上げテキストデータ選択装置およびそのプログラムを提供することを課題とする。

【課題を解決するための手段】

【0008】

前記課題を解決するため、請求項１に記載の音声合成用読み上げテキストデータ選択装置は、読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置であって、音声データ単位辞書記憶手段と、音声データ単位目標数記憶手段と、音声データ単位目標数設定手段と、読み上げテキストデータ選択手段と、を備え、音声データ単位目標数設定手段が、読み上げ済みテキストデータ分割手段と、読み上げ済み音声データ単位計数手段と、目標数設定手段と、を備え、読み上げテキストデータ選択手段が、テキストデータ分割手段と、音声データ単位計数手段と、テキストデータ選択手段と、目標数更新手段と、を備える構成とした。

【0009】

かかる構成において、音声合成用読み上げテキストデータ選択装置は、音声データ単位目標数設定手段によって、音声データ単位辞書記憶手段に記憶されている音声データ単位辞書を参照して、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位ごとの数を計数し、当初の目標数からそれぞれ減算することで、音声データ単位目標数記憶手段において、音声データ単位ごとの新たな目標数を設定する。
すなわち、音声合成用読み上げテキストデータ選択装置は、読み上げ済みテキストデータ分割手段によって、読み上げ済みテキストデータを順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。
そして、音声合成用読み上げテキストデータ選択装置は、読み上げ済み音声データ単位計数手段によって、読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する。これによって、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位が計数される。
そして、音声合成用読み上げテキストデータ選択装置は、目標数設定手段によって、読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、音声データ単位目標数記憶手段において、当初の目標数から減算する。これによって、当初の目標数に対して足りない音声声データ単位ごとの新たな目標数が設定されることになる。

【0010】

そして、音声合成用読み上げテキストデータ選択装置は、読み上げテキストデータ選択手段によって、読み上げテキストデータ候補から、音声データ単位が新たな目標数分含むように読み上げテキストデータを選択する。
すなわち、音声合成用読み上げテキストデータ選択装置は、テキストデータ分割手段によって、読み上げテキストデータ候補を順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。そして、音声合成用読み上げテキストデータ選択装置は、音声データ単位計数手段によって、テキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている目標数がゼロでない音声データ単位を計数する。
これによって、音声合成用読み上げテキストデータ選択装置は、読み上げテキストデータとして選択されたテキストデータにおいて、まだ、当初の目標数分含まれていない音声データ単位のみを計数する。

【0011】

そして、音声合成用読み上げテキストデータ選択装置は、テキストデータ選択手段によって、音声データ単位計数手段で計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新する。
すなわち、テキストデータ選択手段は、繰り返し処理において、その時点で、より多くの音声データ単位を含んだ読み上げテキストデータ候補を読み上げテキストデータとして選択する。これによって、繰り返し処理の時間を短縮することができる。

【0012】

そして、音声合成用読み上げテキストデータ選択装置は、目標数更新手段によって、テキストデータ選択手段で読み上げテキストデータを選択した際に、音声データ単位計数手段で計数された音声データ単位ごとの数を、音声データ単位目標数記憶手段に記憶されている当該音声データ単位の目標数から減算する。
これによって、選択された読み上げテキストデータに含まれている音声データ単位の数が、目標数から減算され、必要以上に音声データ単位を含んだ読み上げテキストデータを選択することを防止することができる。

【0016】

また、請求項２に記載の音声合成用読み上げテキストデータ選択プログラムは、音声データ単位辞書を記憶する音声データ単位辞書記憶手段を備え、読み上げテキストデータ候補から、音声合成の合成単位である音声データ単位を予め定めた目標数分含むように読み上げテキストデータを選択する音声合成用読み上げテキストデータ選択装置のコンピュータを、読み上げ済みテキストデータ分割手段、読み上げ済み音声データ単位計数手段、目標数設定手段、テキストデータ分割手段、音声データ単位計数手段、テキストデータ選択手段、目標数更新手段、として機能させることを特徴とする。

【0017】

かかる構成において、音声合成用読み上げテキストデータ選択プログラムは、読み上げ済みテキストデータ分割手段によって、読み上げ済みテキストデータを順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。
そして、音声合成用読み上げテキストデータ選択プログラムは、読み上げ済み音声データ単位計数手段によって、読み上げ済みテキストデータ分割手段で分割された読み上げ済みテキストデータに含まれている音声データ単位を計数する。
そして、音声合成用読み上げテキストデータ選択プログラムは、目標数設定手段によって、読み上げ済み音声データ単位計数手段で計数された音声データ単位ごとの数を、当初の目標数から減算することで、音声データ単位ごとの新たな目標数を設定する

【0018】

そして、音声合成用読み上げテキストデータ選択プログラムは、テキストデータ分割手段によって、読み上げテキストデータ候補を順次入力し、音声データ単位辞書に登録されている音声データ単位に分割する。
そして、音声合成用読み上げテキストデータ選択プログラムは、音声データ単位計数手段によって、テキストデータ分割手段で分割された読み上げテキストデータ候補に含まれている目標数がゼロでない音声データ単位を計数する。

【0019】

そして、音声合成用読み上げテキストデータ選択プログラムは、テキストデータ選択手段によって、音声データ単位計数手段で計数された音声データ単位のカウント総数が、初期処理時には予め定めた初期値以上で、それ以降ではそれまでに計数されたカウント総数の最大値以上となった読み上げテキストデータ候補を読み上げテキストデータとして選択し、カウント総数の最大値を更新する。
そして、音声合成用読み上げテキストデータ選択プログラムは、目標数更新手段によって、テキストデータ選択手段で読み上げテキストデータを選択した際に、音声データ単位計数手段で計数された音声データ単位ごとの数を、当該音声データ単位の目標数から減算する。

【発明の効果】

【0020】

本発明は、以下に示す優れた効果を奏するものである。
請求項１，２に記載の発明によれば、過去に読み上げテキストデータとして選択されている読み上げ済みテキストデータに含まれている音声データ単位の数を削減して、読み上げテキストデータ候補から、目標数の音声データ単位を含むようにテキストデータを選択するため、足りない音声データ単位を含んだテキストデータのみを読み上げテキストデータとして選択することができる。これによって、音声合成用データベースを生成する場合に、アナウンサが読み上げるテキストデータを少なくすることができる。

【0021】

また、請求項１，２に記載の発明によれば、過去に読み上げテキストデータとして選択されている読み上げ済みテキストデータに含まれている音声データ単位の数を計数し、音声データ単位の不足分となる目標数を正しく設定することができる。これによって、足りない音声データ単位を含んだテキストデータのみを効率よく読み上げテキストデータとして選択することができる。

【図面の簡単な説明】

【0022】

【図1】本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置の構成を示すブロック構成図である。

【図2】本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置の動作を示すフローチャートであって、主に、音声データ単位目標数設定動作を示す。

【図3】本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置の動作を示すフローチャートであって、主に、読み上げテキストデータ選択動作を示す。

【図4】図１の音声データ単位目標数設定手段の動作の一例を説明するための説明図である。

【図5】図１の読み上げテキストデータ選択手段の動作の一例を説明するための説明図である。

【発明を実施するための形態】

【0023】

以下、本発明の実施形態について図面を参照して説明する。
〔本発明の概要〕
図１に示す本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置１（以下、単にテキストデータ選択装置という）は、音声合成に用いる種々の音（音声データ）を集めた音声合成用データベースを作成する際に、予め準備したテキストデータから、種々の音を読み上げるためのテキストデータ（読み上げテキストデータ）を選択するものである。ただし、本発明は、過去に選択されている読み上げテキストデータとの間で音声データが予め定めた数以上重複しないように、新たな読み上げテキストデータを選択することを特徴とする。

【0024】

例えば、政治や経済のニュース原稿（テキストデータ）から選択された読み上げテキストデータをアナウンサが読み上げることで生成された音声合成用データベースを用いて、音声合成を行った場合、政治や経済のニュースに関する音声合成については、自然な音声として合成可能である。しかし、その音声合成用データベースを用いて、スポーツニュースに関する音声合成を行った場合、不自然な音声となることがある。

【0025】

その場合、テキストデータ選択装置１は、音声合成用データベースに登録されている音声データの元となった、過去に選択された読み上げテキストデータとはなるべく重複しないように、スポーツのニュース原稿から、新たな読み上げテキストデータを選択する。
これによって、アナウンサは、過去に選択されて読み上げたテキストデータを再度読み上げる必要はなく、新たに選択されたテキストデータだけを読み上げるだけでよいため、音声合成用データベースを生成する際の音声収録を行う時間や手間を省くことができる。

【0026】

〔音声合成用読み上げテキストデータ選択装置の構成〕
次に、図１を参照して、本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置（テキストデータ選択装置）１の構成について説明する。
図１に示すように、テキストデータ選択装置１は、音声データ単位辞書記憶手段１０と、音声データ単位目標数記憶手段２０と、音声データ単位目標数設定手段３０と、読み上げテキストデータ選択手段４０と、を備える。
なお、テキストデータ選択装置１に入力される読み上げ済みテキストデータは、過去に読み上げテキストデータとして選択されたテキストデータである。また、読み上げテキストデータ候補は、新たに読み上げるテキストデータの候補となるテキストデータである。

【0027】

音声データ単位辞書記憶手段１０は、音声合成を行う際の音声データの単位（音声データ単位）をテキストデータとして羅列した音声データ単位辞書を記憶するものであって、ハードディスク等の一般的な記憶媒体である。この音声データ単位は、音声合成の合成単位であって、例えば、単語、文、音素等である。
なお、音声データ単位辞書記憶手段１０に新たに音声データ単位を追加する場合、図示を省略した入力手段を介して、書き込むこととする。
この音声データ単位辞書記憶手段１０に記憶されている音声データ単位は、音声データ単位目標数設定手段３０および読み上げテキストデータ選択手段４０によって参照され、テキストデータを分割する際の分割単位として利用される。

【0028】

音声データ単位目標数記憶手段２０は、読み上げテキストデータに含ませたい音声データ単位の目標数を記憶するものであって、半導体メモリ等の一般的な記憶媒体である。この音声データ単位目標数は、読み上げテキストデータとして選択するテキストデータのすべてにおいて、個々の音声データ単位を少なくともどれだけ含ませるのかを予め定めた数である。

【0029】

この読み上げテキストデータは、アナウンサ等によって読み上げられることで、音声合成用データベースとして構築されるため、音声データ単位目標数が多いと、それだけ、アナウンサにかかる負荷が増加することになる。
そのため、この音声データ単位目標数の初期値は、音声合成の精度と、テキストデータの読み上げ時間とを考慮して、予め定めておく数であって、“１”以上の任意の数である。

【0030】

この音声データ単位目標数記憶手段２０に記憶される音声データ単位目標数は、予め初期値を記憶しておくが、音声データ単位目標数設定手段３０によって、読み上げテキストデータ候補から、テキストデータを選択する際の音声データ単位目標数が再設定される。
また、音声データ単位目標数記憶手段２０は、読み上げテキストデータ選択手段４０によって参照され、音声データ単位が音声データ単位目標数分含まれるように、読み上げテキストデータ候補から、テキストデータが選択される。

【0031】

音声データ単位目標数設定手段３０は、音声データ単位目標数記憶手段２０に記憶される音声データ単位目標数を設定（再設定）するものである。この音声データ単位目標数設定手段３０は、過去に選択された読み上げ済みテキストデータに含まれている音声データ単位の数だけ初期値から減算した値を新たな音声データ単位目標数として設定する。
ここでは、音声データ単位目標数設定手段３０は、テキストデータ入力手段３１と、テキストデータ分割手段３２と、音声データ単位計数手段３３と、目標数設定手段３４と、を備える。

【0032】

テキストデータ入力手段（読み上げ済みテキストデータ入力手段）３１は、外部から、すでに過去に選択された複数のテキストデータ（読み上げ済みテキストデータ）を入力するものである。この読み上げ済みテキストデータは、例えば、音声合成用読み上げテキストデータ選択装置１によって過去に選択されたテキストデータを用いてもよい。あるいは、特許第４７４１２０８号公報に記載されている音声合成用読み上げテキストデータ選択装置によって過去に選択されたテキストデータを用いてもよい。
このテキストデータ入力手段３１は、入力した読み上げ済みテキストデータを、テキストデータ分割手段３２に出力する。

【0033】

テキストデータ分割手段（読み上げ済みテキストデータ分割手段）３２は、テキストデータ入力手段３１で入力された読み上げ済みテキストデータを、音声データ単位辞書記憶手段１０に記憶されている音声データ単位ごとに分割するものである。この音声データ単位ごとに分割する手法は、例えば、特許第４４６０２４２号の手法等を用いることができる。これ以外にも、例えば、数字の音声合成の場合、音声データ単位辞書記憶手段１０に記憶する音声データ単位を各桁で構成し、テキストデータ分割手段３２は、桁ごとに分割することも可能である。この場合、図４に示すように、「二十七」は、「二十」と「七」とに分割される。
また、例えば、音声データ単位辞書記憶手段１０に記憶する音声データ単位を音素で構成する場合、テキストデータ分割手段３２は、テキストデータを形態素解析し、音素に分割することとする。
このテキストデータ分割手段３２は、音声データ単位に分割したテキストデータを、音声データ単位計数手段３３に出力する。

【0034】

音声データ単位計数手段（読み上げ済み音声データ単位計数手段）３３は、テキストデータ分割手段３２で分割されたテキストデータを音声データ単位ごとにカウント（計数）するものである。これによって、読み上げ済みテキストデータに含まれている音声データ単位の数がカウントされることになる。
この音声データ単位計数手段３３は、音声データ単位ごとのカウント数を目標数設定手段３４に出力する。

【0035】

目標数設定手段３４は、音声データ単位目標数記憶手段２０に記憶されている音声データ単位の数の予め設定された初期値（初期目標数）から、音声データ単位計数手段３３でカウントされた音声データ単位ごとのカウント数を減算して、音声データ単位ごとに、読み上げテキストデータに含ませたい音声データ単位の目標数を設定するものである。

【0036】

すなわち、すでに読み上げ済みテキストデータに含まれており、初期目標数より多くの音声データ単位を含むテキストデータを選択することを避けるため、目標数設定手段３４は、音声データ単位計数手段３３でカウントされた読み上げ済みテキストデータに含まれている音声データ単位の数を、初期目標数から減算することで、音声データ単位の目標数を新たに設定する。
これによって、音声データ単位目標数設定手段３０は、読み上げ済みテキストデータに含まれている音声データ単位の数を、予め定めた数（初期目標数）から減算して、読み上げテキストデータ選択手段４０が読み上げテキストデータを選択する際の音声データ単位の目標数を設定することができる。

【0037】

読み上げテキストデータ選択手段４０は、音声データ単位辞書記憶手段１０に記憶されている音声データ単位が、音声データ単位目標数記憶手段２０に記憶されている目標数分含まれるように、読み上げテキストデータ候補の中からテキストデータを選択するものである。

【0038】

ここでは、読み上げテキストデータ選択手段４０は、テキストデータ入力手段４１と、テキストデータ分割手段４２と、音声データ単位計数手段４３と、テキストデータ選択手段４４と、目標数更新手段４５と、テキストデータ出力手段４６と、を備える。

【0039】

テキストデータ入力手段（読み上げテキストデータ候補入力手段）４１は、外部から、複数の読み上げテキストデータの候補（読み上げテキストデータ候補）を順次入力するものである。この読み上げテキストデータ候補は、音声データ単位辞書記憶手段１０に新たに登録した音声データ単位を含んだ複数のテキストデータである。例えば、音声データ単位として、スポーツ関連の単語を登録した場合、読み上げテキストデータ候補は、過去にスポーツのニュース原稿として用いた複数のテキストデータを用いることができる。
このテキストデータ入力手段４１は、入力した読み上げテキストデータ候補を、テキストデータ分割手段４２およびテキストデータ選択手段４４に出力する。
なお、テキストデータ入力手段４１は、テキストデータ選択手段４４から、読み上げテキストデータ候補の選択判定の完了が通知された段階で、次の読み上げテキストデータ候補を入力し、テキストデータ分割手段４２およびテキストデータ選択手段４４に出力することとする。

【0040】

テキストデータ分割手段（読み上げテキストデータ候補分割手段）４２は、テキストデータ入力手段４１で入力された読み上げテキストデータ候補を、音声データ単位辞書記憶手段１０に記憶されている音声データ単位ごとに分割するものである。
なお、テキストデータ分割手段４２は、テキストデータ分割手段３２と同様の手法でテキストデータを音声データ単位に分割することができる。
このテキストデータ分割手段４２は、読み上げテキストデータ候補ごとに、音声データ単位に分割されたテキストデータを、音声データ単位計数手段４３に出力する。

【0041】

音声データ単位計数手段（読み上げ候補音声データ単位計数手段）４３は、読み上げテキストデータ候補ごとに、テキストデータ分割手段４２で分割された音声データ単位をカウント（計数）するものである。

【0042】

ただし、音声データ単位計数手段４３は、音声データ単位目標数記憶手段２０に記憶されている音声データ単位目標数が“０”になっている音声データ単位、すなわち、すでに目標数分選択されている音声データ単位については、カウントしないこととする。
これによって、音声データ単位計数手段４３は、読み上げテキストデータ候補に含まれている、音声データ単位目標数に達していない音声データ単位の数がカウントされることになる。
この音声データ単位計数手段４３は、読み上げテキストデータ候補ごとに、音声データ単位ごとのカウント数を目標数更新手段４５に出力し、その総数（カウント総数）を、テキストデータ選択手段４４に出力する。

【0043】

テキストデータ選択手段４４は、音声データ単位計数手段４３でカウントされた読み上げテキストデータ候補の音声データ単位のカウント総数が、それまでにカウントされたカウント総数の最大値（カウント最大値）以上である場合に、当該読み上げテキストデータ候補を、読み上げテキストデータとして選択するものである。

【0044】

なお、テキストデータ選択手段４４は、カウント最大値を予め定めた初期値（例えば“０”）に設定しておき、音声データ単位計数手段４３でカウントされる音声データ単位のカウント総数がカウント最大値よりも大きくなった場合に、カウント最大値をそのカウント総数で置き換える。
これによって、テキストデータ選択手段４４は、順次、読み上げテキストデータ候補を選択する際に、より多くの音声データ単位を含んでいる候補を選択することができる。

【0045】

このテキストデータ選択手段４４は、読み上げテキストデータ候補を読み上げテキストデータとして選択した場合、選択した旨を目標数更新手段４５に通知するとともに、テキストデータ入力手段４１で入力された読み上げテキストデータをテキストデータ出力手段４６に出力する。
なお、テキストデータ選択手段４４は、読み上げテキストデータ候補の選択判定を完了した後、テキストデータ入力手段４１にその旨を通知する。これによって、順次、読み上げテキストデータ候補が入力されて、読み上げテキストデータとして選択されるか否かが判定される。

【0046】

目標数更新手段４５は、テキストデータ選択手段４４で読み上げテキストデータを選択した際に、音声データ単位目標数を更新するものである。すなわち、目標数更新手段４５は、読み上げテキストデータが選択された場合、当該テキストデータに含まれている音声データ単位の数を音声データ単位目標数から減算する。

【0047】

ここでは、目標数更新手段４５は、音声データ単位計数手段４３でカウントされた音声データ単位ごとのカウント数を、音声データ単位目標数記憶手段２０に記憶されている該当する音声データ単位から減算する。
このように、読み上げテキストデータが選択されるたびに、当該テキストデータに含まれている音声データ単位の数だけ、音声データ単位目標数が減算される。

【0048】

テキストデータ出力手段４６は、テキストデータ選択手段４４で選択された読み上げテキストデータを外部に出力するものである。
このテキストデータ出力手段４６は、テキストデータ選択手段４４で選択された読み上げテキストデータを逐次出力することとしてもよいし、図示を省略した記憶手段に選択された読み上げテキストデータをすべて蓄積し、外部から出力指示があった段階で出力することとしてもよい。

【0049】

なお、読み上げテキストデータ選択手段４０は、すべての読み上げテキストデータ候補を入力し終わっても、音声データ単位目標数記憶手段２０に記憶されている音声データ単位目標数がすべて“０“にならなかった場合、音声データ単位計数手段４３で増加させたカウント最大値を初期値（“０”）に設定し直して、読み上げテキストデータ候補を最初から入力し直すこととする。
ここで、読み上げ済みテキストデータおよび読み上げテキストデータ候補に、必要な音声データ単位が目標数分含まれていれば、音声データ単位目標数記憶手段２０に記憶されている音声データ単位目標数はすべて“０“になる。

【0050】

なお、本発明においては、読み上げ済みテキストデータおよび読み上げテキストデータ候補には、必要な音声データ単位が目標数分含まれていることを前提としている。もし、その前提とならない読み上げ済みテキストデータおよび読み上げテキストデータ候補を対象とするのであれば、それらのテキストデータについて音声データ単位を累計し、目標数分含まれているか否かを判定する判定手段（不図示）を備え、目標数に達していない音声データ単位を表示手段（不図示）に表示することで、操作者に警告することとすればよい。

【0051】

以上説明したようにテキストデータ選択装置１を構成することで、テキストデータ選択装置１は、音声データ単位を追加した分だけ、読み上げテキストデータを追加して選択することができる。これによって、過去に選択された読み上げ済みテキストデータをアナウンサが読み上げる手間を省いて、追加分のテキストデータのみを読み上げるだけで、音声合成用データベースを構築することが可能になる。
なお、テキストデータ選択装置１は、一般的なコンピュータを、前記した各手段として機能させるプログラム（音声合成用読み上げテキストデータ選択プログラム）で動作させることができる。

【0052】

〔音声合成用読み上げテキストデータ選択装置の動作〕
次に、図２，図３を参照して、本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置（テキストデータ選択装置）１の動作について説明する。
ここでは、読み上げ済みテキストデータを入力して、音声データ単位目標数を設定する動作（音声データ単位目標数設定動作）と、読み上げテキストデータ候補から音声データ単位目標数の音声データ単位を含んだテキストデータを選択する動作（読み上げテキストデータ選択動作）とに分けて説明する。

【0053】

（音声データ単位目標数設定動作）
最初に、図２を参照（構成については、適宜図１参照）して、テキストデータ選択装置１の音声データ単位目標数設定動作について説明する。
まず、テキストデータ選択装置１は、予め音声データ単位目標数記憶手段２０に、読み上げテキストデータに含ませたい音声データ単位の目標数を設定しておく（ステップＳ１）。

【0054】

そして、テキストデータ選択装置１は、テキストデータ入力手段３１によって、外部から、すでに過去に選択された複数のテキストデータ（読み上げ済みテキストデータ）を入力する（ステップＳ２）。
そして、テキストデータ選択装置１は、テキストデータ分割手段３２によって、ステップＳ２で入力された読み上げ済みテキストデータを、音声データ単位辞書記憶手段１０に記憶されている音声データ単位ごとに分割する（ステップＳ３）。

【0055】

さらに、テキストデータ選択装置１は、音声データ単位計数手段３３によって、ステップＳ３で分割された音声データ単位のテキストデータを音声データ単位ごとにカウント（計数）する（ステップＳ４）。
このステップＳ４でカウントされた音声データ単位の数は、読み上げ済みテキストデータに含まれている音声データ単位の数である。

【0056】

そこで、テキストデータ選択装置１は、目標数設定手段３４によって、音声データ単位目標数記憶手段２０に記憶されている音声データ単位の数の予め設定された初期目標数から、ステップＳ４でカウントされた音声データ単位ごとのカウント数を減算する（ステップＳ５）。
ここで、テキストデータ選択装置１は、読み上げ済みテキストデータをすべて入力し終わった場合（ステップＳ６でＹｅｓ）、動作を終了し、まだ、読み上げ済みテキストデータが存在する場合（ステップＳ６でＮｏ）、ステップＳ２に戻って、動作を継続する。

【0057】

（読み上げテキストデータ選択動作）
次に、図３を参照（構成については、適宜図１参照）して、テキストデータ選択装置１の読み上げテキストデータ選択動作について説明する。

【0058】

図２で説明した音声データ単位目標数設定動作の後、テキストデータ選択装置１は、読み上げテキストデータ選択手段４０のテキストデータ選択手段４４で使用する、テキストデータ内の音声データ単位のカウント総数の最大値（カウント最大値）を、初期値（“０”）に設定する（ステップＳ１０）。

【0059】

そして、テキストデータ選択装置１は、テキストデータ入力手段４１によって、外部から、読み上げテキストデータの候補（読み上げテキストデータ候補）を入力する（ステップＳ１１）。
そして、テキストデータ選択装置１は、テキストデータ分割手段４２によって、ステップＳ１１で入力された読み上げテキストデータ候補を、音声データ単位辞書記憶手段１０に記憶されている音声データ単位ごとに分割する（ステップＳ１２）。

【0060】

さらに、テキストデータ選択装置１は、音声データ単位計数手段４３によって、ステップＳ１２で分割された音声データ単位のテキストデータを音声データ単位ごとにカウント（計数）する（ステップＳ１３）。ただし、音声データ単位計数手段４３は、音声データ単位目標数記憶手段２０に記憶されている音声データ単位目標数が“０”になっている音声データ単位については、カウントを行わない。

【0061】

そして、テキストデータ選択装置１は、テキストデータ選択手段４４によって、ステップＳ１３でカウントされた読み上げテキストデータ候補の音声データ単位のカウント総数（音声データ単位数）が、それまでにカウントされたカウント総数の最大値（カウント最大値）以上であるか否かを判定する（ステップＳ１４）。

【0062】

ここで、音声データ単位数が、カウント最大値以上の場合（ステップＳ１４でＹｅｓ）、テキストデータ選択装置１は、テキストデータ選択手段４４によって、当該読み上げテキストデータ候補を、読み上げテキストデータとして選択し（ステップＳ１５）、カウント最大値を、ステップＳ１３でカウントされた音声データ単位のカウント総数（音声データ単位数）で更新する（ステップＳ１６）。

【0063】

さらに、テキストデータ選択装置１は、目標数更新手段４５によって、ステップＳ１３でカウントされた音声データ単位ごとのカウント数を、音声データ単位目標数記憶手段２０に記憶されている該当する音声データ単位から減算することで、音声データ単位目標数を更新し（ステップＳ１７）、ステップＳ１８に動作を進める。
一方、ステップＳ１３でカウントされた音声データ単位数が、カウント最大値未満の場合（ステップＳ１４でＮｏ）、テキストデータ選択装置１は、当該読み上げテキストデータ候補を選択せずに、ステップＳ１８に動作を進める。

【0064】

そして、テキストデータ選択装置１は、読み上げテキストデータ候補をすべて入力し終わっていない場合（ステップＳ１８でＮｏ）、ステップＳ１１に戻って、次の読み上げテキストデータ候補に対して前記同様の処理を行う。
一方、テキストデータ選択装置１は、読み上げテキストデータ候補をすべて入力し終わった場合（ステップＳ１８でＹｅｓ）、さらに、音声データ単位目標数記憶手段２０に記憶されている音声データ単位目標数がすべて“０“になったか否かを判定する（ステップＳ１９）。

【0065】

ここで、音声データ単位目標数がすべて“０“になっていない場合（ステップＳ１９でＮｏ）、テキストデータ選択装置１は、ステップＳ１０に戻って、カウント最大値を初期化し、再度、初めから読み上げテキストデータ候補を順次読み込んで、テキストデータを選択する。
一方、音声データ単位目標数がすべて“０“になった場合（ステップＳ１９でＹｅｓ）、テキストデータ選択装置１は、テキストデータ入力手段４１によって、ステップＳ１５で選択されたテキストデータを、読み上げテキストデータとして出力する（ステップＳ２０）。

【0066】

以上の動作によって、テキストデータ選択装置１は、音声データ単位を目標数含んだテキストデータを選択する際に、読み上げ済みテキストデータに含まれている音声データ単位の数を目標数から減算した数を新たな目標数として、読み上げテキストデータを選択するため、追加した音声データ単位に対して、必要なテキストデータのみを選択することができる。

【0067】

〔音声合成用読み上げテキストデータ選択装置の動作の具体例〕
次に、図４，図５を参照して、本発明の実施形態に係る音声合成用読み上げテキストデータ選択装置（テキストデータ選択装置）１の動作の具体例について説明する。
ここでは、数値音声合成データベースを生成する際に読み上げる数字をテキストデータとした例で説明する。
なお、ここでは、「一」から「九十九」までの数字のうちで、「十八」および「二十七」がすでに読み上げ済みテキストデータして選択されているものとする。
そして、「十八」および「二十七」を除く「一」から「九十九」までの数字が、「九十九」から「一」の順で読み上げテキストデータ候補として入力されるものとする。

【0068】

（音声データ単位目標数設定動作）
最初に、図４を参照（構成については、適宜図１参照）して、テキストデータ選択装置１の音声データ単位目標数設定動作の具体例について説明する。
図４（ａ）に示すように、音声データ単位辞書記憶手段１０には、予め数字の「一」、「二」、「三」、「四」、「五」、「六」、「七」、「八」、「九」、「十」、「二十」、「三十」、「四十」、「五十」、「六十」、「七十」、「八十」、「九十」を、音声データ単位として記憶しておく。
なお、図示はしていないが、音声データ単位目標数記憶手段２０には、読み上げテキストデータとして含ませたい音声データ単位の目標数を“１”に設定しておく。

【0069】

そして、図４（ｂ）に示すように、テキストデータ選択装置１に、読み上げ済みテキストデータとして「十八」および「二十七」が入力された場合、テキストデータ分割手段３２によって、音声データ単位辞書記憶手段１０に記憶されている音声データ単位で、「十」，「八」と「二十」，「七」とに分割する。
さらに、テキストデータ選択装置１は、音声データ単位計数手段３３によって、分割されたそれぞれの音声データ単位の個数をカウントする。この例では、音声データ単位である「十」，「八」，「二十」，「七」のカウント数が“１”とカウントされる。

【0070】

そして、テキストデータ選択装置１は、目標数設定手段３４によって、カウントされた読み上げ済みテキストデータに含まれている音声データ単位の数を、音声データ単位目標数設定手段３０に記憶されている目標数から減算する。
これによって、図４（ｃ）に示すように、音声データ単位目標数記憶手段２０には、音声データ単位「七」，「八」，「十」，「二十」の目標数が“０”に設定される。
このように、音声データ単位目標数記憶手段２０には、読み上げテキストデータ候補から読み上げテキストデータを選択する際の基準となる音声データ単位の目標数が設定される。

【0071】

（読み上げテキストデータ選択動作）
次に、図５を参照（構成については、適宜図１参照）して、テキストデータ選択装置１の読み上げテキストデータ選択動作の具体例について説明する。
図５（ａ）に示すように、テキストデータ選択装置１に、読み上げテキストデータ候補として「九十九」が入力された場合、「九十九」は、テキストデータ分割手段４２によって、音声データ単位辞書記憶手段１０に記憶されている音声データ単位で、「九十」，「九」に分割される。

【0072】

ここで、音声データ単位計数手段４３が音声データ単位数をカウントした結果は、“２”であり、初期値として予め設定されているカウント最大値“０”以上である。そこで、テキストデータ選択手段４４は、「九十九」を読み上げテキストデータとして選択し、カウント最大値を、音声データ単位数“２”に更新する。
そして、音声データ単位「九十」，「九」については、読み上げテキストデータに含まれることとなったため、図５（ｂ）に示すように、目標数更新手段４５によって、音声データ単位目標数記憶手段２０に記憶されている「九十」，「九」の目標数を、カウント数“１”ずつ減算して“０”に更新する。

【0073】

次に、図５（ｃ）の（ｃ−１）に示すように、テキストデータ選択装置１に、読み上げテキストデータ候補として「九十八」が入力された場合、「九十八」は、テキストデータ分割手段４２によって、音声データ単位辞書記憶手段１０に記憶されている音声データ単位で、「九十」，「八」に分割される。

【0074】

ここで、音声データ単位「九十」，「八」は、図５（ｂ）に示すように、目標数が“０”となっている。そこで、音声データ単位計数手段４３において、目標数が“０”でない音声データ単位数をカウントした結果は“０”となり、カウント最大値“２”未満となる。この場合、テキストデータ選択手段４４は、「九十八」を読み上げテキストデータとして選択しない。
同様に、「九十七」，「九十六」，…，「八十七」の読み上げテキストデータ候補についても、音声データ単位計数手段４３において、目標数が“０”でない音声データ単位数がカウント最大値“２”以上とならないため、選択されない。

【0075】

次に、図５（ｃ）の（ｃ−２）に示すように、テキストデータ選択装置１に、読み上げテキストデータ候補として「八十六」が入力された場合、「八十六」は、テキストデータ分割手段４２によって、音声データ単位辞書記憶手段１０に記憶されている音声データ単位で、「八十」，「六」に分割される。

【0076】

ここで、音声データ単位「八十」，「六」は、図５（ｂ）に示すように、目標数が“０”ではない。そこで、音声データ単位計数手段４３において、目標数が“０”でない音声データ単位数をカウントした結果は“２”となり、カウント最大値“２”以上となる。
この場合、テキストデータ選択手段４４は、「八十六」を読み上げテキストデータとして選択する。なお、このとき、カウント最大値は、音声データ単位数と同じ（“２”）であるため更新されない。

【0077】

この後、読み上げテキストデータ候補のうち、「七十五」，「六十四」，「五十三」，「四十二」，「三十一」が読み上げテキストデータとして選択されることになる。また、これによって、音声データ単位目標数記憶手段２０に記憶されている音声データ単位の目標数がすべて“０”になるため、テキストデータ選択装置１は、ここで動作を終了する。
ただし、最後の読み上げテキストデータ候補を処理しても目標数がすべて“０”にならない場合は、カウント最大値を“０”にリセットして、最初から読み上げテキストデータ候補を入力し直す。

【0078】

以上説明したテキストデータ選択装置１によれば、これまでに読み上げテキストデータが存在し、すでに読み上げられた音声が存在する場合に、音声合成に足りない音声だけを追加するために必要なテキストデータのみを選択することができる。
これによって、音声合成データベースを生成するために、アナウンサが追加分のテキストデータだけを読み上げればよいため、音声収録を行う時間や手間を省くことができる。

【符号の説明】

【0079】

１音声合成用読み上げテキストデータ選択装置（テキストデータ選択装置）
１０音声データ単位辞書記憶手段
２０音声データ単位目標数記憶手段
３０音声データ単位目標数設定手段
３１テキストデータ入力手段（読み上げ済みテキストデータ入力手段）
３２テキストデータ分割手段（読み上げ済みテキストデータ分割手段）
３３音声データ単位計数手段（読み上げ済み音声データ単位計数手段）
３４目標数設定手段
４０読み上げテキストデータ選択手段
４１テキストデータ入力手段（読み上げテキストデータ候補入力手段）
４２テキストデータ分割手段（読み上げテキストデータ候補分割手段）
４３音声データ単位計数手段（読み上げ候補音声データ単位計数手段）
４４テキストデータ選択手段
４５目標数更新手段
４６テキストデータ出力手段

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6185712号(P6185712)IP Force 特許公報掲載プロジェクト 2022.1.31 β版