IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱重工業株式会社の特許一覧

<>
  • 特開-単語登録方法および単語登録装置 図1
  • 特開-単語登録方法および単語登録装置 図2
  • 特開-単語登録方法および単語登録装置 図3
  • 特開-単語登録方法および単語登録装置 図4
  • 特開-単語登録方法および単語登録装置 図5
  • 特開-単語登録方法および単語登録装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022183617
(43)【公開日】2022-12-13
(54)【発明の名称】単語登録方法および単語登録装置
(51)【国際特許分類】
   G10L 15/06 20130101AFI20221206BHJP
   B63H 21/21 20060101ALI20221206BHJP
   B63H 21/22 20060101ALI20221206BHJP
【FI】
G10L15/06 200Z
B63H21/21
B63H21/22 Z
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021091033
(22)【出願日】2021-05-31
(71)【出願人】
【識別番号】000006208
【氏名又は名称】三菱重工業株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(74)【代理人】
【識別番号】100161702
【弁理士】
【氏名又は名称】橋本 宏之
(74)【代理人】
【識別番号】100189348
【弁理士】
【氏名又は名称】古都 智
(74)【代理人】
【識別番号】100196689
【弁理士】
【氏名又は名称】鎌田 康一郎
(72)【発明者】
【氏名】宇津見 晋
(72)【発明者】
【氏名】野田 英介
(72)【発明者】
【氏名】山田 雄介
(72)【発明者】
【氏名】桝田 貴博
(72)【発明者】
【氏名】森山 浩道
(57)【要約】      (修正有)
【課題】移動体の操縦に用いられる音声認識エンジンの発音辞書への単語の登録作業の効率化を図る単語登録方法及び単語登録装置を提供する。
【解決手段】単語登録方法は、移動体の操縦時に発声されるセリフを入力する音声認識エンジンの発音辞書に単語を登録する方法であって、移動体の操縦時に発声されるセリフに含まれる単語を抽出するステップと、抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、セリフ中における前後の単語と結合して一単語にまとめる第1のまとめステップと、抽出した単語及び一単語にまとめられた単語を発音辞書に登録するステップと、を有する。
【選択図】図3
【特許請求の範囲】
【請求項1】
移動体の操縦に用いられる音声認識エンジンの発音辞書への単語の登録方法であって、
前記操縦時に発声されるセリフに含まれる単語を抽出するステップと、
前記抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、前記セリフ中における前後の単語と結合して一単語にまとめる第1の結合処理を行うステップと、
前記抽出した単語、および、前記一単語にまとめられた単語を前記発音辞書に登録するステップと、
を有する単語登録方法。
【請求項2】
前記セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合に、当該組に属する二つの単語を一単語にまとめる第2の結合処理を行うステップを更に有する、
請求項1に記載の単語登録方法。
【請求項3】
前記第1の結合処理を実行した後に前記第2の結合処理を実行する、
請求項2に記載の単語登録方法。
【請求項4】
移動体の操縦に用いられる音声認識エンジンの発音辞書に単語を登録する装置であって、
前記操縦時に発声されるセリフに含まれる単語を抽出する抽出部と、
前記抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、前記セリフ中における前後の単語と結合して一単語にまとめる第1の結合処理部と、
前記抽出した単語、および、一単語にまとめられた単語を前記発音辞書に登録する登録部と、
を備える単語登録装置。
【請求項5】
移動体の操縦に用いられる音声認識エンジンの発音辞書への単語の登録方法であって、
前記操縦時に発声されるセリフに含まれる単語を抽出するステップと、
前記セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合に、当該組に属する二つの単語を一単語にまとめるステップと、
前記抽出した単語、および、一単語にまとめられた単語を前記発音辞書に登録するステップと、
を有する単語登録方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、単語登録方法および単語登録装置に関する。
【背景技術】
【0002】
通常、船舶などの移動体では、発令者(船長など)が発声した操舵号令を操縦員が聞き、その意味を認識し、操舵を行う。近年、働き手の減少による省人化を進めるべく、音声認識エンジンを用いて、発令者の操舵号令の発声により、操縦員を介さずに操縦することが望まれている。そのためには、操舵号令の音声認識の精度を高める必要がある。
【0003】
本開示に関連する技術として、特許文献1には、指示音声データに対して音声認識処理を行うことによって指示動作情報を特定することが開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2019-214466号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
一般的な音声認識エンジンでは、発音辞書に単語(テキスト情報)と発音(音響モデル)の組み合わせを登録することで、一単語として認識すべき単語をカスタマイズすることができる。音声認識エンジンの認識率を高めるためにはこの発音辞書を作りこむ必要があるが、音声認識エンジンの誤認識の傾向を把握しながらの試行錯誤を要するため、手間がかかる。
【0006】
本開示の目的は、移動体の操縦(操舵)に用いられる音声認識エンジンの発音辞書への単語の登録作業の効率化を図ることにある。
【課題を解決するための手段】
【0007】
本開示の一態様によれば、単語登録方法は、移動体の操縦に用いられる音声認識エンジンの発音辞書への単語の登録方法であって、前記操縦時に発声されるセリフに含まれる単語を抽出するステップと、前記抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、前記セリフ中における前後の単語と結合して一単語にまとめる第1の結合処理を行うステップと、前記抽出した単語、および、前記一単語にまとめられた単語を前記発音辞書に登録するステップと、を有する。
【0008】
本開示の一態様によれば、単語登録装置は、移動体の操縦に用いられる音声認識エンジンの発音辞書に単語を登録する装置であって、前記操縦時に発声されるセリフに含まれる単語を抽出する抽出部と、前記抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、前記セリフ中における前後の単語と結合して一単語にまとめる第1の結合処理部と、前記抽出した単語、および、一単語にまとめられた単語を前記発音辞書に登録する登録部と、を備える。
【0009】
本開示の一態様によれば、単語登録方法は、移動体の操縦に用いられる音声認識エンジンの発音辞書への単語の登録方法であって、前記操縦時に発声されるセリフに含まれる単語を抽出するステップと、前記セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合に、当該組に属する二つの単語を一単語にまとめるステップと、前記抽出した単語、および、一単語にまとめられた単語を前記発音辞書に登録するステップと、を有する。
【発明の効果】
【0010】
上述の各態様によれば、移動体の操縦に用いられる音声認識エンジンの発音辞書への単語の登録作業の効率化を図ることができる。
【図面の簡単な説明】
【0011】
図1】第1の実施形態に係る操縦制御装置の全体構成を示す図である。
図2】第1の実施形態に係る発音辞書のデータ構成の例を示す図である。
図3】第1の実施形態に係る発音辞書への単語の登録作業の流れを示す図である。
図4】第1の実施形態に係る登録作業における各処理の具体例を示す図である。
図5】第1の実施形態に係る登録作業における各処理の具体例を示す図である。
図6】第2の実施形態に係る単語登録装置の構成を示す図である。
【発明を実施するための形態】
【0012】
<第1の実施形態>
以下、第1の実施形態に係る発音辞書への単語の登録方法について、図1から図5を参照しながら詳しく説明する。
【0013】
(操縦制御装置の全体構成)
図1は、第1の実施形態に係る操縦制御装置の全体構成を示す図である。
図1に示す操縦制御装置9は、移動体の一例である船舶の操縦(操舵)に用いられる。この操縦制御装置は、発令者による操舵号令の発声にしたがい、自動で(操縦員を介さずに)船舶の操縦(操舵)を制御する。
【0014】
操縦制御装置9は、発声された操舵号令を認識するための音声認識エンジン1を備える。音声認識エンジン1は、操舵号令の発声音声を入力し、それをテキスト情報に変換する。操縦制御装置9は、音声認識エンジン1によって変換されたテキスト情報に基づいてその発声内容(操舵号令)の意味を解釈し、操舵制御を行う。なお、本実施形態に係る音声認識エンジン1は、既存技術を利用したものであってよい。
【0015】
音声認識エンジン1は、発音辞書10を含む。発音辞書10は、認識させたい単語(テキスト情報)とその発音(音響モデル)とを関連付けて登録してある情報テーブルである。音声認識エンジン1は、この発音辞書10を参照することで、入力された音声が音響モデルに整合する単語を特定し、テキスト情報に変換する。
【0016】
(発音辞書の例)
図2は、第1の実施形態に係る発音辞書のデータ構成の例を示す図である。
図2に示すように、発音辞書10は、単語(テキスト)と発音(音響モデル)とが関連付けられてなる。
図2における『単語』は、テキスト情報であり、「2」、「3」などの算用数字の他、「面舵」、「一杯」などの単語が登録されている。図2における『発音』は、各『単語』に対応する発音である。一つの単語に対して複数通りの発音がなされる場合は、その全てを対応させる。例えば、数字の「2」なる単語に対しては、「に」(NI)、「にー」(NII)、「ふた」(HUTA)なる複数の発音を関連付ける。
【0017】
(発音辞書の登録作業の流れ)
図3は、第1の実施形態に係る発音辞書への単語の登録作業の流れを示す図である。
図4図5は、第1の実施形態に係る登録作業における各処理の具体例を示す図である。
以下、図3図5を参照しながら、本実施形態に係る単語登録方法の流れについて詳しく説明する。
【0018】
図3に示す処理フローは、操縦制御装置9の運用開始前の段階で、音声認識エンジン1に認識させるべき単語を発音辞書10に登録する作業の流れを示している。
【0019】
図3に示すように、まず、作業者は、船舶の操舵号令として用いられる全セリフ(例えば、100種類程度のセリフ)を俯瞰し、登録すべき単語(登録候補とする単語)を抽出する(ステップS01)。ここでは、例えば、「取舵一杯」(とりかじいっぱい)、「面舵一杯」(おもかじいっぱい)などの使用頻度の高いセリフは、そのセリフそのものを一単語として登録候補に加える。また、「一杯」(いっぱい)は、他のセリフでも用いられるため、「取舵一杯」、「面舵一杯」とは別の単語として登録候補に加える。また、上述した通り、例えば「2」(に、にー、ふた)のように、一つの単語に対し複数の読み方がある単語については、その全ての発音を関連付けて登録候補に加える。
以下、ステップS01で、登録候補としてリストアップした全ての単語と発音の組み合わせのリストを「登録候補単語群」とも表記する。
【0020】
次に、作業者は、ステップS01でリストアップした登録候補単語群のうち、母音の配列パターンが一致する単語が複数存在するか否かを判定する(ステップS02)。母音の配列パターンが一致する単語が複数存在する場合(ステップS02;YES)、作業者は、その単語の一つを、セリフ中の前後の単語と結合した別の一単語に置き換える(ステップS03)。
【0021】
ここで、「母音の配列パターン」とは、各単語の発音において、母音の種類(「A」、「I」、「U」、「E」、「O」の5種類)と、その個数および並び順のことを指す。「母音の配列パターンが一致する」とは、各単語の発音において、母音の種類、個数および並び順が完全に一致することを指す。
【0022】
上述したステップS02~ステップS03の処理については図4を参照しながらより詳細に説明する。
【0023】
図4に示すように、登録候補単語群の中に、「8」(はち:HACHI)なる単語と、「舵」(舵:KAJI)なる単語とが含まれていたとする。この場合、この2つの単語「8」および「舵」は、母音の配列パターンが「A」→「I」で一致する単語どうしである。
【0024】
この場合、作業者は、対象となる単語の一つ(「8」、「舵」のいずれか一方)を選択し、その単語をセリフ中に登場する前後の単語と結合した一単語に置き換える。ここで例えば、作業者が「舵」を選択した場合、作業者は、操舵号令に用いる全セリフで「舵」の前後にある単語を調べる。
【0025】
その結果、「舵」なる単語が、操舵号令の全セリフ中で『舵切れ』、『舵取れ』の2通りで用いられていたとする。この場合、作業者は、「舵」(かじ:KAJI)なる単語を登録候補単語群から除外し、その代わりに、「舵切れ」(かじきれ:KAJIKIRE)、「舵取れ」(かじとれ:かじとれ)の二単語を登録候補に加える。ここで、「舵切れ」なる単語は、セリフ中で「舵」と前後関係にある「切れ」を結合して一単語にまとめた単語であり、「舵取れ」なる単語は、セリフ中で「舵」と前後関係にある「取れ」を結合して一単語にまとめた単語である。
以上のようにして、「舵」なる単語が「舵切れ」、「舵取れ」の二単語に置き換えられることとなる。なお、新たに追加した「舵切れ」、「舵取れ」の二単語は、母音の配列パターンが一致する単語どうしではない。
【0026】
図3に戻り、次に、作業者は、ステップS01~ステップS03を経て得られた登録候補単語群を対象に、セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致するものがあるか否かを判定する(ステップS04)。一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する単語の組がある場合(ステップS04;YES)、作業者は、その二単語を結合した一単語を登録候補単語群に加える(ステップS05)。
【0027】
上述したステップS04~ステップS05の処理については図5を参照しながらより詳細に説明する。
【0028】
図5に示すように、登録候補単語群の中に、「速さ」(はやさ:HAYASA)なる単語と、「3」(さん:SAN)なる単語とが含まれていたとする。この2つの単語「速さ」および「3」は、セリフの中で前後につなげて使用される場合がある。例えば、『速さ30』というセリフは、「速さ」(はやさ:HAYASA)なる単語と、「3」(さん:SAN)なる単語をこの順につなげたものを含んで構成される。さらに、一つ目の単語「速さ」(はやさ:HAYASA)の最後の母音「A」と二つ目の単語「3」(さん:SAN)の最初の母音「A」が一致する。
【0029】
この場合、作業者は、「速さ」、「3」の単語の組みを結合して、「速さ3」(はやささん:HAYASASAN)なる一単語にまとめ、これを登録候補単語群に追加する。
【0030】
同様に、登録候補単語群の中に、「5」(ご:GO)なる単語と、「度」(ど:DO)なる単語とが含まれていたとする。この2つの単語「5」および「度」は、セリフの中で前後につなげて使用される場合がある。例えば、『15度』というセリフは、「5」(5:GO)なる単語と、「度」(ど:DO)なる単語をこの順につなげたものを含んで構成される。さらに、一つ目の単語「5」(ご:GO)の最後の母音「O」と二つ目の単語「度」(ど:DO)の最初の母音「O」が一致する。
【0031】
この場合、作業者は、「5」、「度」の単語の組みを結合して、「5度」(ごど:GODO)なる一単語にまとめ、これを登録候補単語群に追加する。
【0032】
図3に戻り、次に、作業者は、ステップS02~S03およびステップS04~S05の処理を経て得られた登録候補単語群に含まれている単語を発音辞書に登録する。そして、各単語についての実際の認識率を確認する(ステップS06)。
各単語について認識率が100%未満となったかどうかを判断し、100%未満となった単語については(ステップS07;NO)、個々の単語に対し、発音辞書を個別にカスタマイズする(ステップS08)。単語ごとの個別のカスタマイズ例としては、以下のとおりである。
(例)辞書のセリフ(操舵号令)に無い数字が出現する誤認識(例えば、辞書セリフ“面舵一杯”が“面舵一杯5”として誤認識される)に対しては、数字は「度」などの単位と共にのみ使用がされるように、限定するロジック処理を施す。
【0033】
全ての単語について認識率が100%を得られたら登録作業を終了する(ステップS07;YES)。
【0034】
(作用、効果)
以上の通り、本実施形態に係る発音辞書の登録方法は、登録候補単語群において、母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、セリフ中における前後の単語と結合して一単語にまとめる処理(第1の結合処理)を行うことを特徴とする(図3のステップS02~S03)。
【0035】
ここで、音声認識エンジン1(既存技術の音声認識エンジン)に対する誤認識の傾向を調査した結果、母音の配列パターンが同じ単語は、互いに、誤認識が発生しやすい傾向にあることが分かった。例えば、「8」(はち:HACHI)なる単語と、「舵」(かじ:KAJI)なる単語は、互いに、音声認識エンジンで誤認識されやすいことが分かった。
そこで、上記のようにすることで、発音辞書に、互いに誤認識されやすい単語どうしが登録されることを回避することができる。例えば、「8」(はち:HACHI)なる単語と「舵」(かじ:KAJI)なる単語は誤認識されやすいが、「8」(はち:HACHI)と、「舵切れ」(舵切れ:KAJIKIRE)もしくは「舵取れ」(かじとれ:KAJITORE)との関係であれば、母音の配列パターンが互いに異なることから、音声認識エンジン1で誤認識されやすい関係とはならない。
【0036】
また、本実施形態に係る発音辞書の登録方法は、セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合に、当該組に属する二つの単語を一単語にまとめる処理(第2の結合処理)を行うことを特徴とする(図3のステップS04~S05)。
【0037】
ここで、音声認識エンジン1に対する誤認識の傾向を調査した結果、つなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合、音声認識エンジン1での誤認識が発生しやすいことが分かった。例えば、セリフ中に『速さ3』が含まれる場合、音声認識エンジン1はこれを「速さ」と「3」の単語の組み合わせとして認識しづらい傾向があり、同様に、セリフ中に『5度』が含まれる場合、音声認識エンジン1はこれを「5」と「度」の単語の組み合わせとして認識しづらい傾向があることが分かった。
そこで、上記のようにすることで、セリフ中に登場する『速さ3』を「速さ3」(ながささん:HAYSASAN)という一単語として認識されるようにする。これにより、音声認識エンジン1は、『速さ3』なるセリフを、「速さ」、「3」なる2つの単語の組み合わせとして認識しようとするよりも、「速さ3」という一つの単語として認識するようになるので、誤認識が抑制される。
【0038】
また、本実施形態に係る発音辞書の登録方法は、図3のステップS02~S03(第1の結合処理)を実行した後にステップS04~S05(第2の結合処理)を実行する。
このように、先にステップS02~S03の処理を実行することで、ステップS04~S05の処理の対象とする単語の個数を減らすことができる。したがって、図3の処理フロー全体の処理負荷を低減させることができる。
【0039】
(第1の実施形態の変形例)
上述した第1の実施形態では、図3のステップS02~S03(第1の結合処理)、および、ステップS04~S05(第2の結合処理)の両方を含むものとして説明したが、他の実施形態においてはこの態様に限定されない。例えば、他の実施形態に係る単語登録方法では、ステップS02~S03(第1の結合処理)、ステップS04~S05(第2の結合処理)のいずれか一方のみを行う態様であってもよい。
【0040】
また、上述した第1の実施形態では、図3のステップS03(第1の結合処理)において単語を置き換えるものとして説明したが、他の実施形態においてはこの態様に限定されない。例えば、他の実施形態においては、図3のステップS03において、一単語にまとめられた単語を、登録候補単語群に追加する態様としてもよい。
【0041】
<第2の実施形態>
第1の実施形態では、図3に示す処理フローを作業者が実行し、手動で登録作業を行っていくものとして説明したが、他の実施形態において、この態様に限定されない。即ち、図3に示す処理フローは、装置によって自動的に実行される態様であってもよい。
第2の実施形態に係る単語登録装置について、図6を参照しながら説明する。
【0042】
(単語登録装置の構成)
図6は、第2の実施形態に係る単語登録装置の構成を示す図である。
図6に示すように、単語登録装置2は、船舶(移動体)の操舵(操縦)に用いられる音声認識エンジン1の発音辞書10に単語を登録する装置である。単語登録装置2は、一般的なコンピュータの構成として、CPU20と、メモリ21と、入出力インタフェース22と、記録媒体23とを備えている。
【0043】
CPU20は、単語登録装置2の動作全体を司るプロセッサであり、所定のプログラムに従って動作することで種々の機能を発揮する。CPU20の各機能については後述する。
メモリ21は、いわゆる主記憶装置であり、CPU20を動作させるためのプログラム等が読み込まれる。
入出力インタフェース22は、外部デバイスとの情報のやり取りを行う通信用インタフェースである。本実施形態において、入出力インタフェース22は、操舵号令として用いられる全セリフの内容を示す情報の入力を受け付ける。
記録媒体23は、HDDやSSDなどの大容量記憶装置である。
【0044】
CPU100は、プログラムに従って動作することで、抽出部201、第1の結合処理部202、第2の結合処理部203および登録部204としての機能を発揮する。
【0045】
抽出部201は、操舵(操縦)時に発声されるセリフに含まれる単語を抽出する(図3のステップS01)。
【0046】
第1の結合処理部202は、抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、セリフ中における前後の単語と結合して一単語にまとめる(図3のステップS02~S03)。
【0047】
第2の結合処理部203は、セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合に、当該組に属する二つの単語を一単語にまとめる(図3のステップS04~S05)。
【0048】
登録部204は、抽出した単語、および、一単語にまとめられた単語を発音辞書10に登録する(図3のステップS06)。
【0049】
上述の実施形態においては、単語登録装置2が実行する各種処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって上記各種処理が行われる。また、コンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしてもよい。
【0050】
上記プログラムは、上述した機能の一部を実現するためのものであってもよい。更に、上述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0051】
以上のとおり、本開示に係るいくつかの実施形態を説明したが、これら全ての実施形態は、例として提示したものであり、発明の範囲を限定することを意図していない。これらの実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で種々の省略、置き換え、変更を行うことができる。これらの実施形態及びその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【0052】
<付記>
各実施形態に記載の単語登録方法および単語登録装置は、例えば以下のように把握される。
【0053】
(1)第1の態様において、単語登録方法は、船舶(移動体)の操舵(操縦)に用いられる音声認識エンジン1の発音辞書10への単語の登録方法であって、操舵時に発声されるセリフに含まれる単語を抽出するステップと、前記抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、前記セリフ中における前後の単語と結合して一単語にまとめる第1の結合処理を行うステップと、前記抽出した単語、および、前記一単語にまとめられた単語を前記発音辞書に登録するステップと、を有する。
【0054】
(2)第2の態様において、単語登録方法は、セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合に、当該組に属する二つの単語を一単語にまとめる第2の結合処理を行うステップを更に有する。
【0055】
(3)第3の態様において、単語登録方法は、第1の結合処理を実行した後に第2の結合処理を実行する。
【0056】
(4)第4の態様において、単語登録装置2は、移動体の操縦に用いられる音声認識エンジンの発音辞書に単語を登録する装置であって、操縦時に発声されるセリフに含まれる単語を抽出する抽出部201と、前記抽出した単語のうち母音の配列パターンが同じ単語が複数存在する場合に、当該母音の配列パターンが同じ単語のうちの一つを、前記セリフ中における前後の単語と結合して一単語にまとめる第1の結合処理部202と、前記抽出した単語、および、一単語にまとめられた単語を前記発音辞書に登録する登録部204と、を備える。
【0057】
(5)第5の態様において、単語登録方法は、移動体の操縦に用いられる音声認識エンジンの発音辞書への単語の登録方法であって、前記操縦時に発声されるセリフに含まれる単語を抽出するステップと、前記セリフ中でつなげて使用される二つの単語の組のうち、一つ目の単語の最後の母音と二つ目の単語の最初の母音とが一致する場合に、当該組に属する二つの単語を一単語にまとめるステップと、前記抽出した単語、および、一単語にまとめられた単語を前記発音辞書に登録するステップと、を有する。
【符号の説明】
【0058】
9 操縦制御装置
1 音声認識エンジン
10 発音辞書
2 単語登録装置
図1
図2
図3
図4
図5
図6