特開2023-75425 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧 ▶ 一般財団法人ＮＨＫエンジニアリングシステムの特許一覧

特開2023-75425言語処理装置、学習装置及びそれらのプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023075425

(43)【公開日】2023-05-31

(54)【発明の名称】言語処理装置、学習装置及びそれらのプログラム

(51)【国際特許分類】

G10L 13/08 20130101AFI20230524BHJP

G10L 13/06 20130101ALI20230524BHJP

【ＦＩ】

G10L13/08 110A

G10L13/06 240Z

【審査請求】未請求

【請求項の数】8

【出願形態】ＯＬ

(21)【出願番号】P 2021188324

(22)【出願日】2021-11-19

(71)【出願人】

【識別番号】000004352

【氏名又は名称】日本放送協会

(71)【出願人】

【識別番号】591053926

【氏名又は名称】一般財団法人ＮＨＫエンジニアリングシステム

(74)【代理人】

【識別番号】110001807

【氏名又は名称】弁理士法人磯野国際特許商標事務所

(72)【発明者】

【氏名】栗原清

(72)【発明者】

【氏名】水野真由美

(72)【発明者】

【氏名】清山信正

(57)【要約】

【課題】アクセント辞書と学習ベースの言語処理部とを併用できる言語処理装置を提供する。
【解決手段】言語処理装置１は、アクセント辞書１０を用いて、固有名詞を指示記号で囲われた読み仮名及び韻律記号に変換する固有名詞変換部１１と、指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第１ニューラルネットワークを用いて、漢字仮名交じり文を中間言語データに変換する言語処理部１２と、アクセント結合するように学習した第２ニューラルネットワークを用いて、中間言語データのアクセント結合を行うアクセント結合部１３とを備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換する言語処理装置であって、
固有名詞毎に前記読み仮名及び前記韻律記号が予め登録されたアクセント辞書を用いて、前記漢字仮名交じり文に含まれる固有名詞を、所定の指示記号で囲われた前記読み仮名及び前記韻律記号に変換する固有名詞変換部と、
前記指示記号で囲われた部分を除き、前記漢字仮名交じり文を前記中間言語データに変換するように学習した第１ニューラルネットワークを用いて、前記固有名詞変換部で変換された漢字仮名交じり文を前記中間言語データに変換する言語処理部と、
連続する２つのアクセント句をアクセント結合するように学習した第２ニューラルネットワークを用いて、前記言語処理部が変換した中間言語データのアクセント結合を行うアクセント結合部と、
を備えることを特徴とする言語処理装置。

【請求項2】

前記第１ニューラルネットワークは、Ｔｒａｎｓｆｏｒｍｅｒであることを特徴とする請求項１に記載の言語処理装置。

【請求項3】

前記第２ニューラルネットワークは、Ｔｒａｎｓｆｏｒｍｅｒであることを特徴とする請求項１又は請求項２に記載の言語処理装置。

【請求項4】

漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換するためのニューラルネットワークを学習する学習装置であって、
所定の指示記号で囲われた部分を除き、前記漢字仮名交じり文を前記中間言語データに変換するように第１ニューラルネットワークを学習する言語処理部と、
前記中間言語データで連続する２つのアクセント句をアクセント結合するように第２ニューラルネットワークを学習するアクセント結合部と、
を備えることを特徴とする学習装置。

【請求項5】

前記第１ニューラルネットワークは、Ｔｒａｎｓｆｏｒｍｅｒであることを特徴とする請求項４に記載の学習装置。

【請求項6】

前記第２ニューラルネットワークは、Ｔｒａｎｓｆｏｒｍｅｒであることを特徴とする請求項４又は請求項５に記載の学習装置。

【請求項7】

コンピュータを、請求項１から請求項３の何れか一項に記載の言語処理装置として機能させるためのプログラム。

【請求項8】

コンピュータを、請求項４から請求項６の何れか一項に記載の学習装置として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、音声合成用の言語処理装置、学習装置及びそれらのプログラムに関する。

【背景技術】

【0002】

特許文献１には、読み仮名及び韻律記号で記述された中間言語データを用いる、Ｓｅｑｕｅｎｃｅ－ｔｏ－Ｓｅｑｕｅｎｃｅ方式の日本語音声合成手法が提案されている。この発明において、読み仮名と韻律記号を漢字仮名交じり文から変換する言語処理部は、解析的手法で実現されている（例えば、非特許文献１）。この従来技術は、解析的手法のため、自動及び手動を含めて学習データを用いた機械学習による学習法を適用できない。そこで、Ｔｒａｎｓｆｏｒｍｅｒを用いた学習ベースの言語処理部を実現する手法が提案されている（例えば、非特許文献２）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２０－３４８８３号公報

【非特許文献】

【0004】

【非特許文献1】“OPEN JTalk”、［online］、［令和３年１１月２日検索］、インターネット＜URL：http://open-jtalk.sourceforge.net/＞

【非特許文献2】懸川直人，原直，阿部匡伸，井島勇祐，“Ｔｒａｎｓｆｏｒｍｅｒを用いた日本語テキストからの読み仮名・韻律記号列推定”，日本音響学会秋季研究発表会，３－２－１７，ｐｐ．８２９－８３２，Ｓｅｐ．２０２０

【発明の概要】

【発明が解決しようとする課題】

【0005】

非特許文献２に記載の手法では、Ｔｒａｎｓｆｏｒｍｅｒが、漢字仮名交じり文を読み仮名及び韻律記号に１対１で変換するため、漢字仮名交じり文に含まれる固有名詞の変換にアクセント辞書を利用できず、誤変換を招くという問題がある。

【0006】

図９を参照し、従来技術の問題点を具体的に説明する。
図９の例では、「今日の新潟県胎内市の天気予報です。」という漢字仮名交じり文を、「キョ！ウノ＃ニ＾イガタケ！ン＃タ！イウチ＃シ＾ノ＃テ＾ンキヨ！ホウ＃デ！ス＝」という中間言語データに変換している。なお、図９では、中間言語データにおいて、説明に関係する部分を破線で図示した。例えば、気象情報では、「胎内」などの地名は重要な単語なので、アクセント辞書を用いて、「胎内」という地名を「タ！イナイ」という読み仮名及び韻律記号に正確に変換しなければならない。しかし、Ｔｒａｎｓｆｏｒｍｅｒを用いた言語処理部では、「胎内」という地名を「タ！イウチ」という読み仮名及び韻律記号に誤変換してしまうことがある。このような中間言語データの誤変換は、事後的に修正するのに非常に手間がかかる点と、自動化による修正を前提としないシステムを用いる場合に読み間違いの原因となる点とが問題となる。

【0007】

そこで、本発明は、アクセント辞書と、学習ベースの言語処理部とを併用できる言語処理装置、学習装置及びそれらのプログラムを提供することを課題とする。

【課題を解決するための手段】

【0008】

前記課題を解決するため、本発明に係る言語処理装置は、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換する言語処理装置であって、固有名詞変換部と、言語処理部と、アクセント結合部とを備える構成とした。

【0009】

かかる構成によれば、固有名詞変換部は、固有名詞毎に読み仮名及び韻律記号が予め登録されたアクセント辞書を用いて、漢字仮名交じり文に含まれる固有名詞を、所定の指示記号で囲われた読み仮名及び韻律記号に変換する。
また、言語処理部は、指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第１ニューラルネットワークを用いて、固有名詞変換部で変換された漢字仮名交じり文を中間言語データに変換する。
そして、アクセント結合部は、連続する２つのアクセント句をアクセント結合するように学習した第２ニューラルネットワークを用いて、言語処理部が変換した中間言語データのアクセント結合を行う。

【0010】

また、前記課題を解決するため、本発明に係る学習装置は、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換するためのニューラルネットワークを学習する学習装置であって、言語処理部と、アクセント結合部とを備える構成とした。

【0011】

かかる構成によれば、言語処理部は、所定の指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように第１ニューラルネットワークを学習する。
また、アクセント結合部は、中間言語データで連続する２つのアクセント句をアクセント結合するように第２ニューラルネットワークを学習する。

【0012】

このように、学習装置は、アクセント辞書に登録されている固有名詞を中間言語データに変換しないように第１ニューラルネットワークを学習する。そして、言語処理装置は、この第１ニューラルネットワークを用いて、アクセント辞書で変換した固有名詞を除き、漢字仮名交じり文を中間言語データに変換するので、アクセント辞書と、学習ベースの言語処理部とを併用できる。

【0013】

なお、本発明は、コンピュータを前記した言語処理装置又は学習装置として機能させるためのプログラムで実現することもできる。

【発明の効果】

【0014】

本発明によれば、アクセント辞書と、学習ベースの言語処理部とを併用できるので、固有名詞の誤変換を抑制できる。

【図面の簡単な説明】

【0015】

【図1】実施形態に係る言語処理装置の構成を示すブロック図である。

【図2】実施形態において、韻律記号の一例を説明する説明図である。

【図3】実施形態において、言語処理装置の変換モードを説明する説明図である。

【図4】実施形態において、第１ニューラルネットワークの学習を説明する説明図である。

【図5】実施形態において、第２ニューラルネットワークの学習を説明する説明図である。

【図6】図１の言語処理装置の動作を示すフローチャートである。

【図7】実施例において、編集画面の一例を説明する説明図である。

【図8】実施例において、言語処理サーバを説明する説明図である。

【図9】従来技術を説明する説明図である。

【発明を実施するための形態】

【0016】

以下、本発明の実施形態について図面を参照して説明する。但し、以下に説明する実施形態は、本発明の技術思想を具体化するためのものであって、特定的な記載がない限り、本発明を以下のものに限定しない。また、同一の手段には同一の符号を付し、説明を省略する場合がある。

【0017】

［言語処理装置の構成］
図１を参照し、実施形態に係る言語処理装置１の構成について説明する。
言語処理装置１は、変換モードと学習モードという２つの動作モードを有する。変換モードでは、言語処理装置１が、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換する。学習モードでは、言語処理装置（学習装置）１が、漢字仮名交じり文を読み仮名及び韻律記号で記述された中間言語データに変換するためのニューラルネットワークを学習する。なお、学習モードで動作する言語処理装置１を学習装置と呼ぶ場合がある。これら動作モードは、言語処理装置１の利用者が、図示を省略したキーボード、マウスなどの操作手段を用いて、手動で切り替えることができる。

【0018】

＜変換モード＞
以下、言語処理装置１の構成を変換モード、学習モードの順で説明する。
図１に示すように、言語処理装置１は、アクセント辞書１０と、固有名詞変換部１１と、言語処理部１２と、アクセント結合部１３とを備える。

【0019】

アクセント辞書１０は、地名、氏名、名称などの固有名詞毎に読み仮名及び韻律記号が予め登録されたものであり、後記する固有名詞変換部１１が参照する。例えば、アクセント辞書１０は、地名「胎内」と、その読み仮名及び韻律記号である「タ！イナイ」とが対応付けて登録されている。

【0020】

アクセント辞書１０は、既知の手法で構築できる。例えば、ｍｅｃａｂ、ｇｉｎｚａなどの形態素解析で文中の固有名詞を取得すると共に、取得した固有名詞の読み仮名及び韻律記号を既知のアクセント辞書から抽出すればよい（例えば、参考文献１）。

【0021】

参考文献１：「ＮＨＫ日本語発音アクセント新辞典」、［online］、［令和３年１１月２日検索］

【0022】

ここで、図２を参照し、中間言語データに用いられる韻律記号を説明する（例えば、参考文献２）。図２に例示するように、韻律情報には、アクセント位置の指定、句・フレーズの区切り指定、文末イントネーションの指定、ポーズの指定などの種類がある。アクセント位置の指定を表す韻律記号には、アクセント上昇記号「＾」と、アクセント下降記号「！」がある。アクセント上昇記号「＾」は、その記号の直後の仮名（モーラ）でアクセントが上昇することを示す。アクセント下降記号「！」は、その記号の直後の仮名（モーラ）でアクセントが下降することを表す。アクセント上昇記号「＾」及びアクセント下降記号「！」は、アクセントを表す第一韻律記号である。句・フレーズの区切りの指定には、アクセント句の区切りを表す韻律記号「＃」が用いられる。文末イントネーションの指定には、通常の文末を表す韻律記号「＝」、体言止めの文末を表す韻律記号「（」、及び、疑問の文末を表す韻律記号「？」が用いられる。ポーズの指定には、ポーズを表す韻律記号「，」が用いられる。アクセント句の区切りを表す韻律記号「＃」、通常の文末を表す韻律記号「＝」、体言止めの文末を表す韻律記号「（」、疑問の文末を表す韻律記号「？」及びポーズを表す韻律記号「，」は、読みの区切りを表す第二韻律記号である。なお、これらの韻律記号は一例であり、他の記号を用いてもよい。

【0023】

参考文献２「音声入出力方式標準化専門委員会，JEITA規格 IT-4006、日本語テキスト音声合成用記号，社団法人電子情報技術産業協会，2010年，p.4-10」

【0024】

固有名詞変換部１１は、読み仮名及び韻律記号が予め登録されたアクセント辞書１０を用いて、漢字仮名交じり文に含まれる固有名詞を、所定の指示記号で囲われた読み仮名及び韻律記号に変換するものである。この指示記号は、後記する第１ニューラルネットワークに対して、変換しない部分を指示する記号である。例えば、指示記号は、図２の韻律記号以外で任意に設定可能できる。本実施形態では、指示記号として、固有名詞の先頭を表す「［」と固有名詞の末尾を表す「］」との組が設定されている。なお、指示記号が「［」及び「］」に限定されないことは言うまでもない。

【0025】

図３に示すように、「今日の新潟県胎内市の天気予報です。」という日本語の漢字仮名交じり文が入力された場合を考える。この場合、固有名詞変換部１１は、この漢字仮名交じり文に形態素解析（例えば、ｍｅｃａｂ、ｇｉｎｚａ）を施し、「新潟」や「胎内」などの固有名詞を抽出する。そして、固有名詞変換部１１は、抽出した固有名詞がアクセント辞書１０に登録されているか否かを判定し、登録されている場合、その固有名詞を指示記号で囲われた読み仮名及び韻律記号に変換する。図３の例では、固有名詞変換部１１は、アクセント辞書１０に登録されている「胎内」を、固有名詞の先頭を表す「［」及び固有名詞の末尾を表す「］」で囲われた「［タ！イナイ］」に変換する。従って、固有名詞変換部１１は、「今日の新潟県［タ！イナイ］市の天気予報です。」という漢字仮名交じり文を言語処理部１２に出力する。
なお、図３では、漢字仮名交じり文や中間言語データにおいて、説明に関係する部分を破線で図示した。

【0026】

言語処理部１２は、指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第１ニューラルネットワークを用いて、固有名詞変換部１１で変換された漢字仮名交じり文を中間言語データに変換する。この第１ニューラルネットワークは、指示記号「［」及び「］」で囲われた部分以外の漢字仮名交じり文を中間言語データに変換するように学習したものである。つまり、第１ニューラルネットワークは、漢字仮名交じり文のうち、アクセント辞書１０で変換した固有名詞以外の部分を中間言語データに変換する。例えば、第１ニューラルネットワークとしては、前記したＴｒａｎｓｆｏｒｍｅｒがあげられる（非特許文献２）。

【0027】

図３に示すように、「今日の新潟県［タ！イナイ］市の天気予報です。」という漢字仮名交じり文が入力された場合を考える。この場合、言語処理部１２は、第１ニューラルネットワークによって、指示記号「［」及び「］」で囲われた「［タ！イナイ］」以外の部分を中間言語データに変換する。従って、言語処理部１２は、「キョ！ウノ＃ニ＾イガタケ！ン＃[タ！イナイ]シ＾ノ＃テ＾ンキヨ！ホウ＃デ！ス＝」という中間言語データをアクセント結合部１３に出力する。

【0028】

アクセント結合部１３は、連続する２つのアクセント句をアクセント結合するように学習した第２ニューラルネットワークを用いて、言語処理部１２が変換した中間言語データのアクセント結合を行うものである。例えば、第２ニューラルネットワークとしては、前記したＴｒａｎｓｆｏｒｍｅｒがあげられる。

【0029】

ここで、固有名詞のアクセント誤りは、強い違和感を聴取者に与えることがある。そこで、日本語の漢字仮名交じり文の読み方とアクセントを特定した上で、どのような形でアクセント句が結合するのかを事前に学習し、中間言語データに反映させることとした。つまり、東京方言話者が日本語を話す時に自然に行っているアクセント結合と同等のことを、第２ニューラルネットワークで再現している。例えば、東京方言話者は「胎内市の」という言葉を読み上げると、「タイナイシノ」の「シ」の部分にアクセント核がくるように自然に発話できる。これは「タイナイ」「シノ」という２つのアクセント句の結合が起こった結果、「シ」にアクセントがある「タイナイシノ」という１つのアクセント句になる。このようなアクセント結合の規則性は一般には完全に解明されておらず、ルール化が困難である。そこで、アクセント結合部１３では、そのような規則性を第２ニューラルネットワークで再現する。

【0030】

図３に示すように、「＃[タ！イナイ]シ＾ノ＃」という部分について考える。指示記号を無視すれば、この部分は、「タ！イナイ」というアクセント句と、「シ＾ノ」というアクセント句が連続したものである。１個目のアクセント句「タ！イナイ」は第１モーラにアクセントがある１型であり、２個目のアクセント句「」は第２モーラにアクセントがある２型である。これらアクセント句が結合すると、「タ＾イナイシ！ノ」のように第５モーラにアクセントがある５型となる。このように、アクセント句の型は、何モーラ目にアクセントが存在するかを表している。ここで、アクセント結合部１３は、アクセント結合を学習した第２ニューラルネットワークを用いて、「タ！イナイシ＾ノ」という部分を「タ＾イナイシ！ノ」に変換する。従って、アクセント結合部１３は、「キョ！ウノ＃ニ＾イガタケ！ン＃[タ＾イナイ]シ！ノ＃テ＾ンキヨ！ホウ＃デ！ス＝」という中間言語データを出力する。

【0031】

なお、図３では、説明を分かりやすくするために第何型をカッコ書きで図示しているが、アクセント結合部１３は、この第何型を示す情報を実際に必要とするわけでない。
また、韻律記号「＃」で囲われた部分にはアクセント核が一つしか含まれないという規則がある。そこで、アクセント結合部１３は、韻律記号「＃」で囲われた部分の全てについてアクセント結合を行ってもよい。
また、アクセント結合部１３は、中間言語データを出力する際、その中間言語データから指示記号「［」及び「］」を削除してもよい。

【0032】

＜学習モード＞
図１に戻り、言語処理装置１の学習モードを説明する。
この学習モードでは、言語処理装置１が、言語処理部１２が用いる第１ニューラルネットワーク、及び、アクセント結合部１３が用いる第２ニューラルネットワークの学習を行う。

【0033】

固有名詞変換部１１は、言語処理部１２の訓練データを生成するため、アクセント辞書１０を用いて、入力された漢字仮名交じり文に含まれる固有名詞を指示記号で囲われた読み仮名及び韻律記号に変換する。なお、固有名詞変換部１１の処理自体は、変換モードと同様のため、説明を省略する。

【0034】

言語処理部１２は、所定の指示記号で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように第１ニューラルネットワークを学習する。ここで、言語処理部１２は、固有名詞変換部１１から入力された漢字仮名交じり文を訓練データとして利用できる。図４の例では、中間言語データ「キョ！ウノ＃ニ＾イガタケ！ン＃[タ！イナイ]シ＾ノ＃テ＾ンキヨ！ホウ＃デ！ス＝」が正解データであり、漢字仮名交じり文「今日の新潟県［タ！イナイ］市の天気予報です。」が訓練データである。そして、言語処理部１２は、これら訓練データ及び正解データを用いて、第１ニューラルネットワークを学習する。

【0035】

アクセント結合部１３は、中間言語データで連続する２つのアクセント句をアクセント結合するように第２ニューラルネットワークを学習する。ここで、アクセント結合部１３は、言語処理部１２から入力された中間言語データに含まれる、連続する２つのアクセント句を訓練データとして利用できる。図５の例では、「タ！イナイ」及び「シ＾ノ」という２個のアクセント句が訓練データであり、「タ＾イナイシ！ノ」という結合したアクセント句が正解データである。そして、アクセント結合部１３は、これら訓練データ及び正解データを用いて、第２ニューラルネットワークを学習する。

【0036】

なお、第１ニューラルネットワーク及び第２ニューラルネットワークの学習自体は、一般的なものであるため、説明を省略する。例えば、ＳＧＤ(Stochastic Gradient Descent)、Ａｄａｍなどの一般的なニューラルネット最適化手法を用いて、第１ニューラルネットワーク及び第２ニューラルネットワークを学習すればよい。また、学習の終了条件としては、例えば、「所定の回数のパラメータが更新された」や「パラメータを更新しても誤差が下がらなくなった」があげられる。

【0037】

［言語処理装置の動作］
図６を参照し、言語処理装置１の動作について説明する。
なお、アクセント辞書１０が登録済みであり、第１ニューラルネットワーク及び第２ニューラルネットワークの学習が済んでいることとする。

【0038】

図６に示すように、ステップＳ１において、固有名詞変換部１１は、アクセント辞書１０を用いて、漢字仮名交じり文に含まれる固有名詞を、指示記号「［」及び「］」で囲われた読み仮名及び韻律記号に変換する。

【0039】

ステップＳ２において、言語処理部１２は、指示記号「［」及び「］」で囲われた部分を除き、漢字仮名交じり文を中間言語データに変換するように学習した第１ニューラルネットワークを用いて、ステップＳ１で変換された漢字仮名交じり文を中間言語データに変換する。

【0040】

ステップＳ３において、アクセント結合部１３は、連続する２つのアクセント句をアクセント結合するように学習した第２ニューラルネットワークを用いて、ステップＳ２で変換した中間言語データのアクセント結合を行う。

【0041】

［作用・効果］
以上のように、言語処理装置１は、アクセント辞書１０に登録されている固有名詞を中間言語データに変換しないように第１ニューラルネットワークを学習する。そして、言語処理装置１は、この第１ニューラルネットワークを用いて、アクセント辞書１０で変換した固有名詞を除き、漢字仮名交じり文を中間言語データに変換する。これにより、言語処理装置１は、アクセント辞書１０と、学習ベースの言語処理部１２とを併用できるので、固有名詞の誤変換を抑制し、高品質な中間言語データを生成できる。
さらに、言語処理装置１は、アクセント結合の規則性を中間言語データに反映させて、高品質な中間言語データを生成できる。例えば、この中間言語データを音声合成で利用すれば、自然な合成音声を生成できる。

【0042】

（実施例）
図７を参照し、実施例として、第１ニューラルネットワークの訓練データ及び正解データの生成手法について説明する。
図７には、漢字仮名交じり文のアクセントを生成及び修正する編集装置２（図８）の編集画面１００を図示した（例えば、特開Ｈ０９－１７１３９２号公報）。文書入力画面１１０には、編集装置２に入力された漢字仮名交じり文が表示されている。また、ヨミ・アクセント編集画面１２０には、漢字仮名交じり文に対応するように、その漢字仮名交じり文から解析したアクセント情報が表示されている。このアクセント情報は、漢字仮名交じり文の読み仮名にアクセントの高低を示す記号が付加されている。このとき、図示を省略したマウス、キーボードなどの操作手段を介して、オペレータが、適切なアクセントとなるように編集することもある。そして、このアクセント情報に形態素解析を施すことで、中間言語データを生成できる。

【0043】

ここで、編集装置２の入力となる漢字仮名交じり文が訓練データとして利用できる。また、編集装置２が解析した中間言語データ又はオペレータが編集した中間言語データが正解データとして利用できる。このように、大量で高品質な訓練データ及び正解データが得られるので、高精度な第１ニューラルネットワークを学習できる。

【0044】

図８に示すように、図７の仕組みをネットワーク上で構築することもできる。
ここでは、複数のオペレータが、編集装置２で編集作業を行っている。また、言語処理サーバ１Ｂは、ネットワークを介して、編集装置２から正解データ及び訓練データを収集し、第１ニューラルネットワークを学習する。この言語処理サーバ１Ｂは、図１の言語処理装置１をネットワーク上でサーバ化したものである。そして、言語処理サーバ１Ｂは、学習した第１ニューラルネットワークを用いて中間言語データへの変換を行い、変換した中間言語データを音声合成サーバ３に出力する。さらに、音声合成サーバ３は、言語処理サーバ１Ｂからの中間言語データを用いて、音声合成を行う（例えば、特開２０２０－３４８８３号公報）。

【0045】

以上、実施形態を詳述してきたが、本発明は前記した実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。

【0046】

前記した実施形態では、第１ニューラルネットワーク及び第２ニューラルネットワークがＴｒａｎｓｆｏｒｍｅｒであることとして説明したが、これに限定されない。例えば、第１ニューラルネットワーク及び第２ニューラルネットワークとして、Ｓｅｑｕｅｎｃｅ－ｔｏ－Ｓｅｑｕｅｎｃｅモデル、Ｓｅｑｕｅｎｃｅ－ｔｏ－Ｓｅｑｕｅｎｃｅ＋Ａｔｔｅｎｔｉｏｎ、又は、ＲＮＮ（Recurrent Neural Network)を利用できる。

【0047】

前記した実施形態では、言語処理装置及び学習装置が独立したハードウェアであることとして説明したが、本発明は、これに限定されない。例えば、本発明は、コンピュータが備えるＣＰＵ、メモリ、ハードディスク等のハードウェア資源を、前記した言語処理装置又は学習装置として機能させるためのプログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、ＣＤ－ＲＯＭやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。

【符号の説明】

【0048】

１言語処理装置（学習装置）
１Ｂ言語処理サーバ
２編集装置
３音声合成サーバ
１０アクセント辞書
１１固有名詞変換部
１２言語処理部
１３アクセント結合部

【図1】