IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧 ▶ 一般財団法人NHKエンジニアリングシステムの特許一覧

特開2023-75425言語処理装置、学習装置及びそれらのプログラム
<>
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図1
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図2
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図3
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図4
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図5
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図6
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図7
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図8
  • 特開-言語処理装置、学習装置及びそれらのプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023075425
(43)【公開日】2023-05-31
(54)【発明の名称】言語処理装置、学習装置及びそれらのプログラム
(51)【国際特許分類】
   G10L 13/08 20130101AFI20230524BHJP
   G10L 13/06 20130101ALI20230524BHJP
【FI】
G10L13/08 110A
G10L13/06 240Z
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021188324
(22)【出願日】2021-11-19
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(71)【出願人】
【識別番号】591053926
【氏名又は名称】一般財団法人NHKエンジニアリングシステム
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】栗原 清
(72)【発明者】
【氏名】水野 真由美
(72)【発明者】
【氏名】清山 信正
(57)【要約】
【課題】アクセント辞書と学習ベースの言語処理部とを併用できる言語処理装置を提供する。
【解決手段】言語処理装置1は、アクセント辞書10を用いて、固有名詞を指示記号で囲われた読み仮名及び韻律記号に変換する固有名詞変換部11と、指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第1ニューラルネットワークを用いて、漢字仮名交じり文を中間言語データに変換する言語処理部12と、アクセント結合するように学習した第2ニューラルネットワークを用いて、中間言語データのアクセント結合を行うアクセント結合部13とを備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換する言語処理装置であって、
固有名詞毎に前記読み仮名及び前記韻律記号が予め登録されたアクセント辞書を用いて、前記漢字仮名交じり文に含まれる固有名詞を、所定の指示記号で囲われた前記読み仮名及び前記韻律記号に変換する固有名詞変換部と、
前記指示記号で囲われた部分を除き、前記漢字仮名交じり文を前記中間言語データに変換するように学習した第1ニューラルネットワークを用いて、前記固有名詞変換部で変換された漢字仮名交じり文を前記中間言語データに変換する言語処理部と、
連続する2つのアクセント句をアクセント結合するように学習した第2ニューラルネットワークを用いて、前記言語処理部が変換した中間言語データのアクセント結合を行うアクセント結合部と、
を備えることを特徴とする言語処理装置。
【請求項2】
前記第1ニューラルネットワークは、Transformerであることを特徴とする請求項1に記載の言語処理装置。
【請求項3】
前記第2ニューラルネットワークは、Transformerであることを特徴とする請求項1又は請求項2に記載の言語処理装置。
【請求項4】
漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換するためのニューラルネットワークを学習する学習装置であって、
所定の指示記号で囲われた部分を除き、前記漢字仮名交じり文を前記中間言語データに変換するように第1ニューラルネットワークを学習する言語処理部と、
前記中間言語データで連続する2つのアクセント句をアクセント結合するように第2ニューラルネットワークを学習するアクセント結合部と、
を備えることを特徴とする学習装置。
【請求項5】
前記第1ニューラルネットワークは、Transformerであることを特徴とする請求項4に記載の学習装置。
【請求項6】
前記第2ニューラルネットワークは、Transformerであることを特徴とする請求項4又は請求項5に記載の学習装置。
【請求項7】
コンピュータを、請求項1から請求項3の何れか一項に記載の言語処理装置として機能させるためのプログラム。
【請求項8】
コンピュータを、請求項4から請求項6の何れか一項に記載の学習装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声合成用の言語処理装置、学習装置及びそれらのプログラムに関する。
【背景技術】
【0002】
特許文献1には、読み仮名及び韻律記号で記述された中間言語データを用いる、Sequence-to-Sequence方式の日本語音声合成手法が提案されている。この発明において、読み仮名と韻律記号を漢字仮名交じり文から変換する言語処理部は、解析的手法で実現されている(例えば、非特許文献1)。この従来技術は、解析的手法のため、自動及び手動を含めて学習データを用いた機械学習による学習法を適用できない。そこで、Transformerを用いた学習ベースの言語処理部を実現する手法が提案されている(例えば、非特許文献2)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-34883号公報
【非特許文献】
【0004】
【非特許文献1】“OPEN JTalk”、[online]、[令和3年11月2日検索]、インターネット<URL:http://open-jtalk.sourceforge.net/>
【非特許文献2】懸川直人,原直,阿部匡伸,井島勇祐,“Transformerを用いた日本語テキストからの読み仮名・韻律記号列推定”,日本音響学会秋季研究発表会,3-2-17,pp.829-832,Sep.2020
【発明の概要】
【発明が解決しようとする課題】
【0005】
非特許文献2に記載の手法では、Transformerが、漢字仮名交じり文を読み仮名及び韻律記号に1対1で変換するため、漢字仮名交じり文に含まれる固有名詞の変換にアクセント辞書を利用できず、誤変換を招くという問題がある。
【0006】
図9を参照し、従来技術の問題点を具体的に説明する。
図9の例では、「今日の新潟県胎内市の天気予報です。」という漢字仮名交じり文を、「キョ!ウノ#ニ^イガタケ!ン#タ!イウチ#シ^ノ#テ^ンキヨ!ホウ#デ!ス=」という中間言語データに変換している。なお、図9では、中間言語データにおいて、説明に関係する部分を破線で図示した。例えば、気象情報では、「胎内」などの地名は重要な単語なので、アクセント辞書を用いて、「胎内」という地名を「タ!イナイ」という読み仮名及び韻律記号に正確に変換しなければならない。しかし、Transformerを用いた言語処理部では、「胎内」という地名を「タ!イウチ」という読み仮名及び韻律記号に誤変換してしまうことがある。このような中間言語データの誤変換は、事後的に修正するのに非常に手間がかかる点と、自動化による修正を前提としないシステムを用いる場合に読み間違いの原因となる点とが問題となる。
【0007】
そこで、本発明は、アクセント辞書と、学習ベースの言語処理部とを併用できる言語処理装置、学習装置及びそれらのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0008】
前記課題を解決するため、本発明に係る言語処理装置は、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換する言語処理装置であって、固有名詞変換部と、言語処理部と、アクセント結合部とを備える構成とした。
【0009】
かかる構成によれば、固有名詞変換部は、固有名詞毎に読み仮名及び韻律記号が予め登録されたアクセント辞書を用いて、漢字仮名交じり文に含まれる固有名詞を、所定の指示記号で囲われた読み仮名及び韻律記号に変換する。
また、言語処理部は、指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第1ニューラルネットワークを用いて、固有名詞変換部で変換された漢字仮名交じり文を中間言語データに変換する。
そして、アクセント結合部は、連続する2つのアクセント句をアクセント結合するように学習した第2ニューラルネットワークを用いて、言語処理部が変換した中間言語データのアクセント結合を行う。
【0010】
また、前記課題を解決するため、本発明に係る学習装置は、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換するためのニューラルネットワークを学習する学習装置であって、言語処理部と、アクセント結合部とを備える構成とした。
【0011】
かかる構成によれば、言語処理部は、所定の指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように第1ニューラルネットワークを学習する。
また、アクセント結合部は、中間言語データで連続する2つのアクセント句をアクセント結合するように第2ニューラルネットワークを学習する。
【0012】
このように、学習装置は、アクセント辞書に登録されている固有名詞を中間言語データに変換しないように第1ニューラルネットワークを学習する。そして、言語処理装置は、この第1ニューラルネットワークを用いて、アクセント辞書で変換した固有名詞を除き、漢字仮名交じり文を中間言語データに変換するので、アクセント辞書と、学習ベースの言語処理部とを併用できる。
【0013】
なお、本発明は、コンピュータを前記した言語処理装置又は学習装置として機能させるためのプログラムで実現することもできる。
【発明の効果】
【0014】
本発明によれば、アクセント辞書と、学習ベースの言語処理部とを併用できるので、固有名詞の誤変換を抑制できる。
【図面の簡単な説明】
【0015】
図1】実施形態に係る言語処理装置の構成を示すブロック図である。
図2】実施形態において、韻律記号の一例を説明する説明図である。
図3】実施形態において、言語処理装置の変換モードを説明する説明図である。
図4】実施形態において、第1ニューラルネットワークの学習を説明する説明図である。
図5】実施形態において、第2ニューラルネットワークの学習を説明する説明図である。
図6図1の言語処理装置の動作を示すフローチャートである。
図7】実施例において、編集画面の一例を説明する説明図である。
図8】実施例において、言語処理サーバを説明する説明図である。
図9】従来技術を説明する説明図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態について図面を参照して説明する。但し、以下に説明する実施形態は、本発明の技術思想を具体化するためのものであって、特定的な記載がない限り、本発明を以下のものに限定しない。また、同一の手段には同一の符号を付し、説明を省略する場合がある。
【0017】
[言語処理装置の構成]
図1を参照し、実施形態に係る言語処理装置1の構成について説明する。
言語処理装置1は、変換モードと学習モードという2つの動作モードを有する。変換モードでは、言語処理装置1が、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換する。学習モードでは、言語処理装置(学習装置)1が、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換するためのニューラルネットワークを学習する。なお、学習モードで動作する言語処理装置1を学習装置と呼ぶ場合がある。これら動作モードは、言語処理装置1の利用者が、図示を省略したキーボード、マウスなどの操作手段を用いて、手動で切り替えることができる。
【0018】
<変換モード>
以下、言語処理装置1の構成を変換モード、学習モードの順で説明する。
図1に示すように、言語処理装置1は、アクセント辞書10と、固有名詞変換部11と、言語処理部12と、アクセント結合部13とを備える。
【0019】
アクセント辞書10は、地名、氏名、名称などの固有名詞毎に読み仮名及び韻律記号が予め登録されたものであり、後記する固有名詞変換部11が参照する。例えば、アクセント辞書10は、地名「胎内」と、その読み仮名及び韻律記号である「タ!イナイ」とが対応付けて登録されている。
【0020】
アクセント辞書10は、既知の手法で構築できる。例えば、mecab、ginzaなどの形態素解析で文中の固有名詞を取得すると共に、取得した固有名詞の読み仮名及び韻律記号を既知のアクセント辞書から抽出すればよい(例えば、参考文献1)。
【0021】
参考文献1:「NHK日本語発音アクセント新辞典」、[online]、[令和3年11月2日検索]
【0022】
ここで、図2を参照し、中間言語データに用いられる韻律記号を説明する(例えば、参考文献2)。図2に例示するように、韻律情報には、アクセント位置の指定、句・フレーズの区切り指定、文末イントネーションの指定、ポーズの指定などの種類がある。アクセント位置の指定を表す韻律記号には、アクセント上昇記号「^」と、アクセント下降記号「!」がある。アクセント上昇記号「^」は、その記号の直後の仮名(モーラ)でアクセントが上昇することを示す。アクセント下降記号「!」は、その記号の直後の仮名(モーラ)でアクセントが下降することを表す。アクセント上昇記号「^」及びアクセント下降記号「!」は、アクセントを表す第一韻律記号である。句・フレーズの区切りの指定には、アクセント句の区切りを表す韻律記号「#」が用いられる。文末イントネーションの指定には、通常の文末を表す韻律記号「=」、体言止めの文末を表す韻律記号「(」、及び、疑問の文末を表す韻律記号「?」が用いられる。ポーズの指定には、ポーズを表す韻律記号「,」が用いられる。アクセント句の区切りを表す韻律記号「#」、通常の文末を表す韻律記号「=」、体言止めの文末を表す韻律記号「(」、疑問の文末を表す韻律記号「?」及びポーズを表す韻律記号「,」は、読みの区切りを表す第二韻律記号である。なお、これらの韻律記号は一例であり、他の記号を用いてもよい。
【0023】
参考文献2「音声入出力方式標準化専門委員会,JEITA規格 IT-4006、日本語テキスト音声合成用記号,社団法人 電子情報技術産業協会,2010年,p.4-10」
【0024】
固有名詞変換部11は、読み仮名及び韻律記号が予め登録されたアクセント辞書10を用いて、漢字仮名交じり文に含まれる固有名詞を、所定の指示記号で囲われた読み仮名及び韻律記号に変換するものである。この指示記号は、後記する第1ニューラルネットワークに対して、変換しない部分を指示する記号である。例えば、指示記号は、図2の韻律記号以外で任意に設定可能できる。本実施形態では、指示記号として、固有名詞の先頭を表す「[」と固有名詞の末尾を表す「]」との組が設定されている。なお、指示記号が「[」及び「]」に限定されないことは言うまでもない。
【0025】
図3に示すように、「今日の新潟県胎内市の天気予報です。」という日本語の漢字仮名交じり文が入力された場合を考える。この場合、固有名詞変換部11は、この漢字仮名交じり文に形態素解析(例えば、mecab、ginza)を施し、「新潟」や「胎内」などの固有名詞を抽出する。そして、固有名詞変換部11は、抽出した固有名詞がアクセント辞書10に登録されているか否かを判定し、登録されている場合、その固有名詞を指示記号で囲われた読み仮名及び韻律記号に変換する。図3の例では、固有名詞変換部11は、アクセント辞書10に登録されている「胎内」を、固有名詞の先頭を表す「[」及び固有名詞の末尾を表す「]」で囲われた「[タ!イナイ]」に変換する。従って、固有名詞変換部11は、「今日の新潟県[タ!イナイ]市の天気予報です。」という漢字仮名交じり文を言語処理部12に出力する。
なお、図3では、漢字仮名交じり文や中間言語データにおいて、説明に関係する部分を破線で図示した。
【0026】
言語処理部12は、指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第1ニューラルネットワークを用いて、固有名詞変換部11で変換された漢字仮名交じり文を中間言語データに変換する。この第1ニューラルネットワークは、指示記号「[」及び「]」で囲われた部分以外の漢字仮名交じり文を中間言語データに変換するように学習したものである。つまり、第1ニューラルネットワークは、漢字仮名交じり文のうち、アクセント辞書10で変換した固有名詞以外の部分を中間言語データに変換する。例えば、第1ニューラルネットワークとしては、前記したTransformerがあげられる(非特許文献2)。
【0027】
図3に示すように、「今日の新潟県[タ!イナイ]市の天気予報です。」という漢字仮名交じり文が入力された場合を考える。この場合、言語処理部12は、第1ニューラルネットワークによって、指示記号「[」及び「]」で囲われた「[タ!イナイ]」以外の部分を中間言語データに変換する。従って、言語処理部12は、「キョ!ウノ#ニ^イガタケ!ン#[タ!イナイ]シ^ノ#テ^ンキヨ!ホウ#デ!ス=」という中間言語データをアクセント結合部13に出力する。
【0028】
アクセント結合部13は、連続する2つのアクセント句をアクセント結合するように学習した第2ニューラルネットワークを用いて、言語処理部12が変換した中間言語データのアクセント結合を行うものである。例えば、第2ニューラルネットワークとしては、前記したTransformerがあげられる。
【0029】
ここで、固有名詞のアクセント誤りは、強い違和感を聴取者に与えることがある。そこで、日本語の漢字仮名交じり文の読み方とアクセントを特定した上で、どのような形でアクセント句が結合するのかを事前に学習し、中間言語データに反映させることとした。つまり、東京方言話者が日本語を話す時に自然に行っているアクセント結合と同等のことを、第2ニューラルネットワークで再現している。例えば、東京方言話者は「胎内市の」という言葉を読み上げると、「タイナイシノ」の「シ」の部分にアクセント核がくるように自然に発話できる。これは「タイナイ」「シノ」という2つのアクセント句の結合が起こった結果、「シ」にアクセントがある「タイナイシノ」という1つのアクセント句になる。このようなアクセント結合の規則性は一般には完全に解明されておらず、ルール化が困難である。そこで、アクセント結合部13では、そのような規則性を第2ニューラルネットワークで再現する。
【0030】
図3に示すように、「#[タ!イナイ]シ^ノ#」という部分について考える。指示記号を無視すれば、この部分は、「タ!イナイ」というアクセント句と、「シ^ノ」というアクセント句が連続したものである。1個目のアクセント句「タ!イナイ」は第1モーラにアクセントがある1型であり、2個目のアクセント句「」は第2モーラにアクセントがある2型である。これらアクセント句が結合すると、「タ^イナイシ!ノ」のように第5モーラにアクセントがある5型となる。このように、アクセント句の型は、何モーラ目にアクセントが存在するかを表している。ここで、アクセント結合部13は、アクセント結合を学習した第2ニューラルネットワークを用いて、「タ!イナイシ^ノ」という部分を「タ^イナイシ!ノ」に変換する。従って、アクセント結合部13は、「キョ!ウノ#ニ^イガタケ!ン#[タ^イナイ]シ!ノ#テ^ンキヨ!ホウ#デ!ス=」という中間言語データを出力する。
【0031】
なお、図3では、説明を分かりやすくするために第何型をカッコ書きで図示しているが、アクセント結合部13は、この第何型を示す情報を実際に必要とするわけでない。
また、韻律記号「#」で囲われた部分にはアクセント核が一つしか含まれないという規則がある。そこで、アクセント結合部13は、韻律記号「#」で囲われた部分の全てについてアクセント結合を行ってもよい。
また、アクセント結合部13は、中間言語データを出力する際、その中間言語データから指示記号「[」及び「]」を削除してもよい。
【0032】
<学習モード>
図1に戻り、言語処理装置1の学習モードを説明する。
この学習モードでは、言語処理装置1が、言語処理部12が用いる第1ニューラルネットワーク、及び、アクセント結合部13が用いる第2ニューラルネットワークの学習を行う。
【0033】
固有名詞変換部11は、言語処理部12の訓練データを生成するため、アクセント辞書10を用いて、入力された漢字仮名交じり文に含まれる固有名詞を指示記号で囲われた読み仮名及び韻律記号に変換する。なお、固有名詞変換部11の処理自体は、変換モードと同様のため、説明を省略する。
【0034】
言語処理部12は、所定の指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように第1ニューラルネットワークを学習する。ここで、言語処理部12は、固有名詞変換部11から入力された漢字仮名交じり文を訓練データとして利用できる。図4の例では、中間言語データ「キョ!ウノ#ニ^イガタケ!ン#[タ!イナイ]シ^ノ#テ^ンキヨ!ホウ#デ!ス=」が正解データであり、漢字仮名交じり文「今日の新潟県[タ!イナイ]市の天気予報です。」が訓練データである。そして、言語処理部12は、これら訓練データ及び正解データを用いて、第1ニューラルネットワークを学習する。
【0035】
アクセント結合部13は、中間言語データで連続する2つのアクセント句をアクセント結合するように第2ニューラルネットワークを学習する。ここで、アクセント結合部13は、言語処理部12から入力された中間言語データに含まれる、連続する2つのアクセント句を訓練データとして利用できる。図5の例では、「タ!イナイ」及び「シ^ノ」という2個のアクセント句が訓練データであり、「タ^イナイシ!ノ」という結合したアクセント句が正解データである。そして、アクセント結合部13は、これら訓練データ及び正解データを用いて、第2ニューラルネットワークを学習する。
【0036】
なお、第1ニューラルネットワーク及び第2ニューラルネットワークの学習自体は、一般的なものであるため、説明を省略する。例えば、SGD(Stochastic Gradient Descent)、Adamなどの一般的なニューラルネット最適化手法を用いて、第1ニューラルネットワーク及び第2ニューラルネットワークを学習すればよい。また、学習の終了条件としては、例えば、「所定の回数のパラメータが更新された」や「パラメータを更新しても誤差が下がらなくなった」があげられる。
【0037】
[言語処理装置の動作]
図6を参照し、言語処理装置1の動作について説明する。
なお、アクセント辞書10が登録済みであり、第1ニューラルネットワーク及び第2ニューラルネットワークの学習が済んでいることとする。
【0038】
図6に示すように、ステップS1において、固有名詞変換部11は、アクセント辞書10を用いて、漢字仮名交じり文に含まれる固有名詞を、指示記号「[」及び「]」で囲われた読み仮名及び韻律記号に変換する。
【0039】
ステップS2において、言語処理部12は、指示記号「[」及び「]」で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第1ニューラルネットワークを用いて、ステップS1で変換された漢字仮名交じり文を中間言語データに変換する。
【0040】
ステップS3において、アクセント結合部13は、連続する2つのアクセント句をアクセント結合するように学習した第2ニューラルネットワークを用いて、ステップS2で変換した中間言語データのアクセント結合を行う。
【0041】
[作用・効果]
以上のように、言語処理装置1は、アクセント辞書10に登録されている固有名詞を中間言語データに変換しないように第1ニューラルネットワークを学習する。そして、言語処理装置1は、この第1ニューラルネットワークを用いて、アクセント辞書10で変換した固有名詞を除き、漢字仮名交じり文を中間言語データに変換する。これにより、言語処理装置1は、アクセント辞書10と、学習ベースの言語処理部12とを併用できるので、固有名詞の誤変換を抑制し、高品質な中間言語データを生成できる。
さらに、言語処理装置1は、アクセント結合の規則性を中間言語データに反映させて、高品質な中間言語データを生成できる。例えば、この中間言語データを音声合成で利用すれば、自然な合成音声を生成できる。
【0042】
(実施例)
図7を参照し、実施例として、第1ニューラルネットワークの訓練データ及び正解データの生成手法について説明する。
図7には、漢字仮名交じり文のアクセントを生成及び修正する編集装置2(図8)の編集画面100を図示した(例えば、特開H09-171392号公報)。文書入力画面110には、編集装置2に入力された漢字仮名交じり文が表示されている。また、ヨミ・アクセント編集画面120には、漢字仮名交じり文に対応するように、その漢字仮名交じり文から解析したアクセント情報が表示されている。このアクセント情報は、漢字仮名交じり文の読み仮名にアクセントの高低を示す記号が付加されている。このとき、図示を省略したマウス、キーボードなどの操作手段を介して、オペレータが、適切なアクセントとなるように編集することもある。そして、このアクセント情報に形態素解析を施すことで、中間言語データを生成できる。
【0043】
ここで、編集装置2の入力となる漢字仮名交じり文が訓練データとして利用できる。また、編集装置2が解析した中間言語データ又はオペレータが編集した中間言語データが正解データとして利用できる。このように、大量で高品質な訓練データ及び正解データが得られるので、高精度な第1ニューラルネットワークを学習できる。
【0044】
図8に示すように、図7の仕組みをネットワーク上で構築することもできる。
ここでは、複数のオペレータが、編集装置2で編集作業を行っている。また、言語処理サーバ1Bは、ネットワークを介して、編集装置2から正解データ及び訓練データを収集し、第1ニューラルネットワークを学習する。この言語処理サーバ1Bは、図1の言語処理装置1をネットワーク上でサーバ化したものである。そして、言語処理サーバ1Bは、学習した第1ニューラルネットワークを用いて中間言語データへの変換を行い、変換した中間言語データを音声合成サーバ3に出力する。さらに、音声合成サーバ3は、言語処理サーバ1Bからの中間言語データを用いて、音声合成を行う(例えば、特開2020-34883号公報)。
【0045】
以上、実施形態を詳述してきたが、本発明は前記した実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0046】
前記した実施形態では、第1ニューラルネットワーク及び第2ニューラルネットワークがTransformerであることとして説明したが、これに限定されない。例えば、第1ニューラルネットワーク及び第2ニューラルネットワークとして、Sequence-to-Sequenceモデル、Sequence-to-Sequence + Attention、又は、RNN(Recurrent Neural Network)を利用できる。
【0047】
前記した実施形態では、言語処理装置及び学習装置が独立したハードウェアであることとして説明したが、本発明は、これに限定されない。例えば、本発明は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記した言語処理装置又は学習装置として機能させるためのプログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD-ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
【符号の説明】
【0048】
1 言語処理装置(学習装置)
1B 言語処理サーバ
2 編集装置
3 音声合成サーバ
10 アクセント辞書
11 固有名詞変換部
12 言語処理部
13 アクセント結合部
図1
図2
図3
図4
図5
図6
図7
図8
図9