(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0022】
[構成の説明]
以下、本発明の実施形態を、図面を参照して説明する。
図1は、本発明による音声認識システムの実施形態の構成例を示すブロック図である。
【0023】
図1に示すように、音声認識システム10は、登録サーバ100と、音声認識辞書作成装置200と、音声認識装置300とを含む。なお、音声認識システム10は、音声認識装置300を2台以上含んでいてもよい。
【0024】
また、音声認識システム10は、音声認識辞書作成装置200のみを含んでいてもよい。また、登録サーバ100、音声認識辞書作成装置200、および音声認識装置300は、それぞれ単体で使用可能な装置である。
【0025】
図1に示すように、音声認識辞書作成装置200は、登録サーバ100に保存されている情報を用いて音声認識辞書を作成する。音声認識辞書作成装置200は、作成された音声認識辞書を音声認識装置300に送信する。音声認識装置300は、送信された音声認識辞書を用いて、音声認識処理を行う。
【0026】
図1に示すように、登録サーバ100は、入力部101と、記憶部102とを含む。登録サーバ100は、例えば、音声認識辞書作成装置200と通信可能に接続されている、クラウドサービスで提供される仮想サーバである。
【0027】
入力部101には、音声認識辞書に登録される料理の名称と、名称を構成する各単語の読み方を示す登録用情報が入力される。入力部101は、例えばキーボードやマウスである。また、入力部101は、処理命令が入力されてもよい。
【0028】
登録用情報は、例えば音声認識システム10の管理者によって入力部101に入力される。また、入力部101は、登録用情報をメニュー管理システムなどの外部システムから自動的に取得してもよい。
【0029】
図2は、入力部101に入力される登録用情報の例を示す説明図である。
図2に示す登録用情報は、正しい名称と、名称を構成する各単語の読み方と、有効期間とで構成されている。なお、
図2等には、「名称を構成する各単語の読み方」は、「構成する各単語の読み方」と示されている。
【0030】
正しい名称は、音声認識辞書に登録される料理の名称である。名称を構成する各単語の読み方は、正しい名称が示す料理の名称を構成する各単語の読み方を示す。
【0031】
図2に示すように、正しい名称が「ベーコンレタスバーガー」である登録用情報の名称を構成する各単語の読み方は、「べーこん△れたす△ばーがー」である。
図2等に示す△は、スペースを意味する。名称を構成する各単語の読み方では、正しい名称を構成する各単語が、スペースで区切られている。
【0032】
すなわち、
図2に示す「べーこん△れたす△ばーがー」は、「ベーコンレタスバーガー」が「ベーコン」「レタス」「バーガー」の各単語で構成されていることを示す。また、「ベーコン」「レタス」「バーガー」の各読み方が、「べーこん」「れたす」「ばーがー」であることを示す。
【0033】
有効期間は、正しい名称が示す料理の名称が音声認識辞書への登録対象として有効な期間を示す。
図2に示す例であれば、「アボカドツナバーガー」は、「2015/7/1−2015/7/15」の間だけ音声認識辞書に登録される。
【0034】
なお、
図2に示す「ベーコンレタスバーガー」のように、有効期間には値が設定されなくてもよい。本実施形態では、有効期間に値が設定されていない登録用情報の正しい名称が示す料理の名称は、音声認識辞書に無期限に登録される。
【0035】
音声認識システム10の管理者が登録用情報を入力する場合、管理者が、名称を構成する各単語の読み方や有効期間を具体的に設定する。名称を構成する各単語の読み方であれば、管理者は、料理の名称を構成する各単語の間にスペースを挿入し、各単語を読み仮名にそれぞれ変換する。
【0036】
なお、登録用情報には、
図2に示す情報以外の情報が含まれてもよい。例えば、正しい名称が示す料理の売上の度合いを示す情報が含まれてもよい。また、一般メニュー、季節限定メニュー、地方限定メニューなどの、正しい名称が示す料理の種類を示す情報が含まれてもよい。
【0037】
記憶部102は、入力部101に入力された登録用情報を記憶する機能を有する。なお、登録サーバ100は、記憶部102を含まなくてもよい。登録サーバ100に記憶部102が含まれない場合、入力部101に入力された登録用情報は、例えば辞書作成部202に直接送信される。
【0038】
図1に示すように、音声認識辞書作成装置200は、日付設定部201と、辞書作成部202と、送信部203とを含む。
【0039】
日付設定部201は、辞書作成部202が作成する音声認識辞書が使用される日付を設定する機能を有する。有効期間内に日付設定部201が設定した日付が含まれる登録用情報の正しい名称が示す料理の名称は、音声認識辞書に登録される。
【0040】
辞書作成部202が毎日音声認識辞書を作成し、音声認識装置300が使用する音声認識辞書が毎日新たに作成された音声認識辞書に更新されるような運用であれば、日付設定部201は、現時点の日付を音声認識辞書が使用される日付に設定すればよい。また、日付設定部201は、日付の代わりに期間を設定してもよい。
【0041】
辞書作成部202は、音声認識辞書を作成する機能を有する。辞書作成部202は、記憶部102に記憶されている登録用情報を取得する。辞書作成部202は、取得された登録用情報と、日付設定部201から取得した音声認識辞書が使用される日付とを用いて、音声認識辞書を作成する。以下、辞書作成部202による音声認識辞書の作成処理の例を説明する。
【0042】
図3は、辞書作成部202による音声認識辞書の作成処理の例を示す説明図である。
図3は、辞書作成部202が2015/7/20に使用される音声認識辞書の作成処理の例を示す。すなわち、日付設定部201が設定した日付は「2015/7/20」である。
【0043】
図3(a)は、辞書作成部202が記憶部102から取得した登録用情報を示す。
図3(a)に示す例では、辞書作成部202が記憶部102から取得した登録用情報は1つである。
【0044】
図3(a)に示す登録用情報の有効期間は、「−2099/12」である。本実施形態において「−2099/12」は、対応する料理の名称が無期限に登録されることを意味する。例えば入力部101に入力された際、有効期間に値が設定されなかった登録用情報に対して、記憶部102は、自動的に「−2099/12」を有効期間に設定する。なお、入力部101に入力された際、有効期間に値が設定されなかった登録用情報に対して、記憶部102は、有効期間に値を設定しなくてもよい。
【0045】
図3(b)は、2015/7/20に登録対象として有効な料理の名称の登録用情報を示す。
図3(a)に示す登録用情報に対応する料理の名称は登録対象として無期限に有効であるため、2015/7/20に登録対象として有効な料理の名称になる。
図3(b)に示す例では、辞書作成部202が
図3(a)に示す1つの登録用情報を、有効期間の情報が除かれた状態で取得している。
【0046】
図3(c)は、辞書作成部202が
図3(b)に示す登録用情報に基づいて作成した、正しい名称が示す料理の名称が呼ばれる可能性のある略語の読み方を示す。
図3(c)に示す略語の読み方は、名称を構成する各単語の読み方を基に、辞書作成部202が作成した読み方である。
【0047】
本実施形態の辞書作成部202による略語の読み方の作成の方法を以下に説明する。最初に、辞書作成部202は、名称を構成する各単語の読み方それぞれを、そのまま略語の読み方にする(
図3(c)に示す「べーこん」「れたす」「ばーがー」)。
【0048】
次に、辞書作成部202は、隣り合う複数の単語の読み方が組み合わせられた読み方を、略語の読み方にする(
図3(c)に示す「べーこんれたす」「れたすばーがー」)。次に、辞書作成部202は、正しい名称が示す料理の名称の読み方を、そのまま略語の読み方にする(
図3(c)に示す「べーこんれたすばーがー」)。
【0049】
他の例として、正しい名称が「ベーコンレタストマトバーガー」であり、名称を構成する各単語の読み方が「べーこん」「れたす」「とまと」「ばーがー」である場合を考える。辞書作成部202は、まず名称を構成する各単語の読み方それぞれをそのまま略語の読み方にすることによって、4つの読み方を作成する。
【0050】
次いで、辞書作成部202は、2つの単語の読み方が組み合わせられた略語の読み方と、3つの単語の読み方が組み合わせられた略語の読み方をそれぞれ作成する。2つの単語の読み方が組み合わせられた略語の読み方として、3つの読み方が作成される。また、3つの単語の読み方が組み合わせられた略語の読み方として、2つの読み方が作成される。
【0051】
次いで、辞書作成部202は、正しい名称が示す料理の名称の読み方をそのまま略語の読み方にすることによって、1つの読み方を作成する。
【0052】
辞書作成部202は、2つ以上の単語で構成される料理の名称の略語の読み方を、上記の方法で作成する。なお、「ハンバーガー」のように1つの単語で構成される料理の名称であれば、略語の読み方は、料理の名称の読み方そのもの(「はんばーがー」)のみである。
【0053】
また、本実施形態の辞書作成部202は、調理担当者が発する可能性が低い読み方を、略語の読み方として採用しない。具体的には、「べーこんばーがー」のような離れた2つの単語の読み方が組み合わせられた読み方や、「れたすべーこん」のような通常の料理の名称の読み方と読み順が逆になる読み方は、
図3(c)に示されていない。
【0054】
調理担当者が発する可能性が低い読み方を辞書作成部202が略語の読み方として採用しないことによって、音声認識辞書の容量の縮小や、認識処理における認識率の向上が期待される。なお、辞書作成部202は、調理担当者が発する可能性が低い読み方を略語の読み方として採用してもよい。
【0055】
図3(c)に示すパターン数は、1つの登録用情報から作成された略語の読み方のパターンの数を示す。
図3(c)に示すように、「ベーコンレタスバーガー」に対する略語の読み方は全部で6つある。
【0056】
よって、正しい名称が「ベーコンレタスバーガー」である登録用情報のパターン数は6であるため、
図3(c)に示すパターン数は全て「6」に設定されている。
図3(c)に示す例では重複する略語の読み方が生じないため、パターン数は使用されない。
【0057】
次に、辞書作成部202は、
図3(c)に示す情報からパターン数が除かれた情報を、音声認識辞書として作成する。
図3に示す作成処理の例では、
図15に示すような音声認識辞書が作成される。
【0058】
次に、有効期間に基づいて登録用情報が選別される例を説明する。
図4は、辞書作成部202による音声認識辞書の作成処理の他の例を示す説明図である。
図4も、辞書作成部202が2015/7/20に使用される音声認識辞書の作成処理の例を示す。
【0059】
図4(a)に示す例では、辞書作成部202が記憶部102から取得した登録用情報は2つである。
図4(a)に示す正しい名称が「ベーコンレタスバーガー」の登録用情報の有効期間は「−2099/12」である。また、
図4(a)に示す正しい名称が「アボカドツナバーガー」の登録用情報の有効期間は「2015/7/1−2015/7/15」である。
【0060】
図4(b)は、2015/7/20に登録対象として有効な料理の名称の登録用情報を示す。上記の有効期間を考慮すると、「ベーコンレタスバーガー」は登録対象として無期限に有効であるため、2015/7/20に登録対象として有効な料理の名称になる。
【0061】
同様に上記の有効期間を考慮すると、「アボカドツナバーガー」は2015/7/1−2015/7/15の間に登録対象として有効であるため、2015/7/20に登録対象として有効な料理の名称にならない。よって、
図4(b)には、正しい名称が「ベーコンレタスバーガー」の登録用情報のみが示されている。
【0062】
図4(c)に示す正しい名称が「ベーコンレタスバーガー」の登録用情報から作成される略語の読み方のパターンは、
図3(c)に示すパターンと同様である。
図4に示す作成処理の例では、
図15に示すような音声認識辞書が作成される。
【0063】
次に、異なる正しい名称に対して同一の略語の読み方が作成される場合を説明する。
図5は、辞書作成部202による音声認識辞書の作成処理の他の例を示す説明図である。
図5も、辞書作成部202が2015/7/20に使用される音声認識辞書の作成処理の例を示す。
【0064】
図5(a)に示す例では、辞書作成部202が記憶部102から取得した登録用情報は2つである。
図5(a)に示す登録用情報の有効期間は、どちらも「−2099/12」である。
【0065】
図5(b)は、2015/7/20に登録対象として有効な料理の名称の登録用情報を示す。
図5(a)に示す登録用情報に対応する料理の名称はどちらも登録対象として無期限に有効であるため、どちらも2015/7/20に登録対象として有効な料理の名称になる。よって、
図5(b)には、
図5(a)に示す登録用情報が2つとも示されている。
【0066】
図5(c)は、辞書作成部202が
図5(b)に示す登録用情報に基づいて作成した、正しい名称が示す料理の名称が呼ばれる可能性のある略語の読み方を示す。
【0067】
図5(c)に示す正しい名称が「ベーコンレタスバーガー」の登録用情報から作成される略語の読み方のパターンは、
図3(c)および
図4(c)に示すパターンと同様である。
【0068】
図5(c)に示す正しい名称が「ツナバーガー」の登録用情報から作成される略語の読み方のパターンは、「つなばーがー」「つな」「ばーがー」の3通りである。よって、
図5(c)に示すように、正しい名称が「ツナバーガー」の登録用情報のパターン数は「3」に設定されている。
【0069】
図5(c)に示す太枠で囲われた2つの箇所の略語の読み方は、「ばーがー」で同一である。
図5(c)に示す情報が音声認識辞書としてそのまま使用された場合、音声認識装置300は、「ばーがー」を音声認識した際、どちらの料理の名称を出力すればよいか判断できない。
【0070】
そこで、
図5(c)に示すように、異なる料理の名称に対して同一の略語の読み方が作成された場合、辞書作成部202は、所定の条件に従って、いずれか1つの料理の名称に対する略語の読み方のみを残し、他は削除する。
【0071】
図5(c)に示す例において辞書作成部202が使用する所定の条件は、「パターン数が最小」である。すなわち、「ベーコンレタスバーガー」と「ツナバーガー」のパターン数はそれぞれ「6」と「3」であるため、辞書作成部202は、パターン数が最小である「ツナバーガー」の方を残す。
【0072】
よって、正しい名称が「ツナバーガー」の略語の読み方には「ばーがー」が存続し、正しい名称が「ベーコンレタスバーガー」の略語の読み方からは「ばーがー」が削除される。
図5に示す作成処理の例では、
図6に示すような音声認識辞書が作成される。
【0073】
図6は、音声認識辞書作成装置200が作成する音声認識辞書の例を示す説明図である。
図6に示すように、正しい名称が「ツナバーガー」の略語の読み方のパターンの数は3のままである。また、
図6に示すように、正しい名称が「ベーコンレタスバーガー」の略語の読み方のパターンの数は、上記の処理により6から1減らされた5である。
【0074】
なお、辞書作成部202が上記の所定の条件を用いる場合、例えば管理者は、名称を構成する各単語の読み方を調整すれば、登録させたい方の料理の名称に重複した略語の読み方を対応付けることができる。各単語の読み方を調整することによって重複した略語の読み方が対応付けられる料理の名称を操作する方法を以下に説明する。
【0075】
図7は、辞書作成部202による音声認識辞書の作成処理の他の例を示す説明図である。
図7も、辞書作成部202が2015/7/20に使用される音声認識辞書の作成処理の例を示す。
【0076】
図7(a)に示す例では、辞書作成部202が記憶部102から取得した登録用情報は3つである。
図7(a)に示す登録用情報の有効期間は、いずれも「−2099/12」である。
【0077】
また、
図7(a)に示す正しい名称が「ベーコンレタスバーガー」の2つ目の登録用情報の、名称を構成する各単語の読み方は「ばーがー」である。通常であれば名称を構成する各単語の読み方は「べーこん△れたす△ばーがー」であるが、
図7(a)に示す例では管理者が意図的に各単語の読み方を「ばーがー」としている。
【0078】
図7(b)は、2015/7/20に登録対象として有効な料理の名称の登録用情報を示す。
図7(a)に示す登録用情報に対応する料理の名称はいずれも登録対象として無期限に有効であるため、
図7(b)には、
図7(a)に示す登録用情報が3つとも示されている。
【0079】
図7(c)は、辞書作成部202が
図7(b)に示す登録用情報に基づいて作成した、正しい名称が示す料理の名称が呼ばれる可能性のある略語の読み方を示す。
【0080】
図7(c)に示す正しい名称が「ベーコンレタスバーガー」の1つ目の登録用情報から作成される略語の読み方のパターンは、
図3(c)、
図4(c)、および
図5(c)に示すパターンと同様である。
【0081】
図7(c)に示す正しい名称が「ベーコンレタスバーガー」の2つ目の登録用情報から作成される略語の読み方のパターンは、「ばーがー」の1通りである。よって、
図7(c)に示すように、正しい名称が「ベーコンレタスバーガー」の2つ目の登録用情報のパターン数は「1」に設定されている。
【0082】
図7(c)に示す正しい名称が「ツナバーガー」の登録用情報から作成される略語の読み方のパターンは、
図5(c)に示すパターンと同様である。
【0083】
図7(c)に示す太枠で囲われた3つの箇所の略語の読み方は、「ばーがー」で同一である。辞書作成部202は、
図5(c)に示す例の場合と同様に、所定の条件として「パターン数が最小」を用いて、略語の読み方を残す方の料理の名称を決定する。
【0084】
「ベーコンレタスバーガー」、「ベーコンレタスバーガー」、および「ツナバーガー」のパターン数はそれぞれ「6」、「1」、「3」であるため、辞書作成部202は、パターン数が最小である「ベーコンレタスバーガー」の方を残す。
【0085】
よって、正しい名称が「ベーコンレタスバーガー」の略語の読み方には「ばーがー」が存続し、正しい名称が「ツナバーガー」の略語の読み方からは「ばーがー」が削除される。
図7に示す作成処理の例では、
図8に示すような音声認識辞書が作成される。
【0086】
図8は、音声認識辞書作成装置200が作成する音声認識辞書の他の例を示す説明図である。
図8に示すように、正しい名称が「ベーコンレタスバーガー」の略語の読み方のパターンの数は、結果的に6のままである。また、
図8に示すように、正しい名称が「ツナバーガー」の略語の読み方のパターンの数は、上記の処理により3から1減らされた2である。
【0087】
すなわち、管理者が「ベーコンレタスバーガー」の2つ目の登録用情報の名称を構成する各単語の読み方を「ばーがー」とした理由は、「ばーがー」が音声認識された時に「ベーコンレタスバーガー」が出力されることを望んだためである。以上のように、管理者は、各単語の読み方を調整することによって重複した略語の読み方が対応付けられる料理の名称を操作できる。
【0088】
次に、異なる正しい名称に対して同一の略語の読み方が作成され、略語の読み方のパターンの数が同一である場合を説明する。
図9は、辞書作成部202による音声認識辞書の作成処理の他の例を示す説明図である。
図9も、辞書作成部202が2015/7/20に使用される音声認識辞書の作成処理の例を示す。
【0089】
図9(a)に示す例では、辞書作成部202が記憶部102から取得した登録用情報は2つである。
図9(a)に示す登録用情報の有効期間は、どちらも「−2099/12」である。
【0090】
また、
図9(a)に示す登録用情報には、売上度合いが含まれている。売上度合いは、正しい名称が示す料理の売上の度合いを、大、中、小のいずれかで示す情報である。
図9(a)に示すように、「ツナバーガー」の売上度合いは「大」である。また、「アボカドバーガー」の売上度合いは「中」である。
【0091】
図9(b)は、2015/7/20に登録対象として有効な料理の名称の登録用情報を示す。
図9(a)に示す登録用情報に対応する料理の名称はどちらも登録対象として無期限に有効であるため、
図9(b)には、
図9(a)に示す登録用情報が2つとも示されている。
【0092】
図9(c)は、辞書作成部202が
図9(b)に示す登録用情報に基づいて作成した、正しい名称が示す料理の名称が呼ばれる可能性のある略語の読み方を示す。
【0093】
図9(c)に示す正しい名称が「ツナバーガー」の登録用情報から作成される略語の読み方のパターンは、
図5(c)に示すパターンと同様である。
【0094】
図9(c)に示す正しい名称が「アボカドバーガー」の登録用情報から作成される略語の読み方のパターンは、「あぼかどばーがー」「あぼかど」「ばーがー」の3通りである。よって、
図9(c)に示すように、正しい名称が「アボカドバーガー」の登録用情報のパターン数は「3」に設定されている。
【0095】
図9(c)に示す太枠で囲われた2つの箇所の略語の読み方は、「ばーがー」で同一である。辞書作成部202は、
図5(c)に示す例の場合と同様に、所定の条件として「パターン数が最小」を用いて、略語の読み方を残す方の料理の名称を決定する。
【0096】
しかし、
図9(c)に示すように、「ツナバーガー」と「アボカドバーガー」のパターン数はいずれも「3」であるため、辞書作成部202は、所定の条件に従う料理の名称を1つに絞れない。
【0097】
そこで、辞書作成部202は、二つ目の所定の条件として、「売上度合いが最大」を用いる。「ツナバーガー」と「アボカドバーガー」の売上度合いはそれぞれ「大」と「中」であるため、辞書作成部202は、売上度合いが最大である「ツナバーガー」の方を残す。
【0098】
よって、正しい名称が「ツナバーガー」の略語の読み方には「ばーがー」が存続し、正しい名称が「アボカドバーガー」の略語の読み方からは「ばーがー」が削除される。
図9に示す作成処理の例では、
図10に示すような音声認識辞書が作成される。
【0099】
図10は、音声認識辞書作成装置200が作成する音声認識辞書の他の例を示す説明図である。
図10に示すように、正しい名称が「ツナバーガー」の略語の読み方のパターンの数は3のままである。また、
図10に示すように、正しい名称が「アボカドバーガー」の略語の読み方のパターンの数は、上記の処理により3から1減らされた2である。
【0100】
なお、上記の説明では辞書作成部202が所定の条件として最初に「パターン数が最小」を用い、残す方の料理の名称を1つに絞れない場合は「売上度合いが最大」を用いるとしたが、辞書作成部202は、最初から所定の条件として「売上度合いが最大」を用いてもよい。
【0101】
また、辞書作成部202は、上記の2つの所定の条件以外にも、入力部101に入力された様々な情報に基づいた条件を所定の条件として使用してもよい。また、辞書作成部202は、記憶部102が各登録用情報を管理するための番号である管理番号や、記憶部102に記録された日付に基づいた条件(すなわち、装置内部の情報に基づいた条件)を、所定の条件として使用してもよい。
【0102】
また、辞書作成部202は、異なる正しい名称に対して同一の略語の読み方が作成された場合、対象の全ての正しい名称から同一の略語の読み方を削除してもよい。例えば、
図5(c)の場合、辞書作成部202は、「ツナバーガー」および「ベーコンレタスバーガー」の両方の略語の読み方から「ばーがー」を削除してもよい。
【0103】
単純に同一の略語の読み方が全て削除された場合、音声認識装置300は、対象の略語を音声認識すると、出力対象の料理の名称は無いと判断する。このような場合であっても、音声認識装置300が出力対象を選定できないような事態は回避される。
【0104】
送信部203は、作成された音声認識辞書を音声認識装置300に送信する機能を有する。送信部203には、辞書作成部202から作成された音声認識辞書が入力される。
【0105】
音声認識装置300は、通信網を介して音声認識辞書作成装置200と通信可能に接続されている。音声認識装置300は、例えば、スマートフォンやタブレット型端末である。音声認識装置300がスマートフォンである場合、通信網は、例えば、3GやLTE(Long Term Evolution)などの携帯電話通信網である。
【0106】
[動作の説明]
以下、本実施形態の音声認識辞書作成装置200の動作を
図11を参照して説明する。
図11は、音声認識辞書作成装置200による音声認識辞書作成処理の動作を示すフローチャートである。
【0107】
入力部101に、登録用情報が入力される(ステップS101)。入力された登録用情報は、記憶部102に記憶される。
【0108】
次いで、辞書作成部202が、記憶部102に記憶されている登録用情報と、日付設定部201に設定されている音声認識辞書が使用される日付とを取得する(ステップS102)。
【0109】
次いで、辞書作成部202は、全ての登録用情報の有効期間と、取得された日付との関係が判定されたか否かを確認する(ステップS103)。全ての登録用情報の有効期間と日付との関係が判定された場合(ステップS103におけるYes)、辞書作成部202は、ステップS107の処理を行う。
【0110】
日付との関係が判定されていない有効期間がある場合(ステップS103におけるNo)、辞書作成部202は、判定されていない有効期間の情報を登録用情報から取得する(ステップS104)。
【0111】
次いで、辞書作成部202は、取得された有効期間内に、ステップS102で取得した日付が含まれるか否かを判定する(ステップS105)。取得された有効期間内に日付が含まれる場合(ステップS105におけるYes)、辞書作成部202は、再度ステップS103の処理を行う。
【0112】
取得された有効期間内に日付が含まれない場合(ステップS105におけるNo)、辞書作成部202は、取得された有効期間に対応する登録用情報を、取得された登録用情報一覧から削除する(ステップS106)。削除した後、辞書作成部202は、再度ステップS103の処理を行う。
【0113】
辞書作成部202は、登録対象として有効な全ての料理の名称に対して、略語の読み方が作成されたか否かを確認する(ステップS107)。全ての料理の名称に対して略語の読み方が作成されている場合(ステップS107におけるYes)、辞書作成部202は、ステップS110の処理を行う。
【0114】
略語の読み方が作成されていない料理の名称がある場合(ステップS107におけるNo)、辞書作成部202は、略語の読み方が作成されていない料理の名称を構成する各単語の読み方の情報を、登録用情報から取得する(ステップS108)。
【0115】
次いで、辞書作成部202は、取得された各単語の読み方の情報を用いて、料理の名称の略語の読み方を作成する(ステップS109)。作成した後、辞書作成部202は、再度ステップS107の処理を行う。
【0116】
辞書作成部202は、登録対象として有効な全ての料理の名称に対して作成された略語の読み方の中に、異なる料理の名称に対する同一の略語の読み方があるか否かを確認する(ステップS110)。異なる料理の名称に対する同一の略語の読み方がない場合(ステップS110におけるNo)、辞書作成部202は、ステップS114の処理を行う。
【0117】
異なる料理の名称に対する同一の略語の読み方がある場合(ステップS110におけるYes)、辞書作成部202は、異なる料理の名称にそれぞれ対応する登録用情報のうち、パターン数が最小の登録用情報が複数存在しないか否かを確認する(ステップS111)。
【0118】
パターン数が最小の登録用情報が複数存在しない場合(ステップS111におけるYes)、辞書作成部202は、同一の略語の読み方のうち、パターン数が最小の登録用情報の料理の名称に対する略語の読み方のみを残す。
【0119】
すなわち、辞書作成部202は、他の同一の略語の読み方を、登録用情報に対して作成された略語の読み方一覧から削除する(ステップS112)。削除した後、辞書作成部202は、再度ステップS110の処理を行う。
【0120】
パターン数が最小の登録用情報が複数存在する場合(ステップS111におけるNo)、辞書作成部202は、同一の略語の読み方のうち、所定の条件を満たす登録用情報の料理の名称に対する略語の読み方のみを残す。
【0121】
すなわち、辞書作成部202は、他の同一の略語の読み方を、登録用情報に対して作成された略語の読み方一覧から削除する(ステップS113)。削除した後、辞書作成部202は、再度ステップS110の処理を行う。
【0122】
所定の条件は、例えば
図9に示すように、「登録用情報に含まれる売上度合いが最大」である。なお、所定の条件は、上記の条件以外の条件でもよい。所定の条件は、異なる料理の名称に対する複数の同一の略語の読み方が、1つの料理の名称に対する略語の読み方に絞られるのであれば、どのような条件でもよい。
【0123】
辞書作成部202は、同一の略語の読み方が異なる正しい名称に対応付けられていない、正しい名称と略語の読み方とが対応付けられた情報を音声認識辞書として出力する(ステップS114)。出力した後、音声認識辞書作成装置200は、音声認識辞書作成処理を終了する。
【0124】
以下、本実施形態の音声認識辞書作成装置200のハードウェア構成の具体例を説明する。
図12は、本発明による音声認識辞書作成装置のハードウェア構成例を示す説明図である。
【0125】
図12に示す音声認識辞書作成装置200は、CPU(Central Processing Unit)211と、主記憶部212と、通信部213と、補助記憶部214とを備える。また、人に処理結果または処理内容の経過を提示するための出力部215を備えてもよい。
【0126】
主記憶部212は、データの作業領域やデータの一時退避領域として用いられる。主記憶部212は、例えばRAM(Random Access Memory)である。
【0127】
通信部213は、有線または無線のネットワーク(情報通信ネットワーク)を介して、周辺機器との間でデータを入力および出力する機能を有する。
【0128】
補助記憶部214は、ハードディスク装置などの記憶装置である。補助記憶部214は、例えばROM(Read Only Memory)である。
【0129】
出力部215は、データを出力する機能を有する。出力部215は、例えば液晶ディスプレイ装置等の表示装置、またはプリンタ等の印刷装置である。
【0130】
また、
図12に示すように、音声認識辞書作成装置200において、各構成要素は、システムバス216に接続されている。
【0131】
補助記憶部214は、例えば、
図1に示す辞書作成部202、および送信部203を実現するためのプログラムを記憶している。また、送信部203は、通信部213を介して、音声認識辞書を送信する。
【0132】
なお、音声認識辞書作成装置200は、ハードウェアにより実現されてもよい。例えば、音声認識辞書作成装置200は、内部に
図1に示すような機能を実現するプログラムが組み込まれたLSI(Large Scale Integration)等のハードウェア部品が含まれる回路が実装されてもよい。
【0133】
また、音声認識辞書作成装置200は、
図12に示すCPU211が
図1に示す各構成要素が有する機能を提供するプログラムを実行することによって、ソフトウェアにより実現されてもよい。
【0134】
ソフトウェアにより実現される場合、CPU211が補助記憶部214に格納されているプログラムを、主記憶部212にロードして実行し、音声認識辞書作成装置200の動作を制御することによって、各機能がソフトウェアにより実現される。
【0135】
なお、本発明は、音声認識以外の分野にも適用可能である。例えば、本発明は、キーボードを介して入力された略称が正式名称に変換される際に使用される認識辞書の作成にも適用可能である。音声認識では頻繁に略語が使用されるため、本発明は、音声認識の分野において特に効果を発揮する。
【0136】
次に、本発明の概要を説明する。
図13は、本発明による生成装置の概要を示すブロック図である。本発明による生成装置20は、認識辞書を構成する認識情報であって、名称と名称の略語とを含み、略語ごとに生成された認識情報のうち、同一の略語を含み、それぞれ異なる名称に対応する認識情報に対して、少なくとも1つの認識情報を削除する削除部21(例えば、辞書作成部202)を備える。
【0137】
そのような構成により、生成装置は、同一の略語で呼ばれる可能性がある異なる名称に基づいて、変換される名称が一意に定められる音声認識辞書を生成できる。
【0138】
また、削除部21は、所定の条件を満たす1つの認識情報以外の認識情報を削除してもよい。
【0139】
そのような構成により、生成装置は、変換される名称を、所定の条件を満たす名称にすることができる。
【0140】
また、生成装置20は、認識情報を生成する生成部(例えば、辞書作成部202)を備え、生成部は、名称の略語が認識される対象として有効な期間に認識辞書が使用される時期が含まれる名称のみに基づいて、認識辞書を構成する認識情報を生成してもよい。
【0141】
そのような構成により、生成装置は、所定日に音声認識装置が音声認識する対象の名称のみに関する音声認識辞書を生成できる。
【0142】
また、所定の条件は、認識情報に含まれる名称の略語の数が最小であることでもよい。
【0143】
そのような構成により、生成装置は、構成する単語が少ない名称の略語を優先的に音声認識辞書に登録できる。
【0144】
また、所定の条件は、認識情報に含まれる名称に対応する商品の売上が最大であることでもよい。
【0145】
そのような構成により、生成装置は、売上が大きい商品の名称を優先的に音声認識辞書に登録できる。
【0146】
また、所定の条件は、認識情報に含まれる名称に対応する商品の売上が最小であることでもよい。
【0147】
また、所定の条件は、認識情報に含まれる名称の略語の数が最小であり、かつ名称に対応する商品の売上が最大であることでもよい。
【0148】
そのような構成により、生成装置は、略語の読み方の数が同じである商品の名称のうち、売上が大きい商品の名称を優先的に音声認識辞書に登録できる。
【0149】
また、所定の条件は、認識情報に含まれる名称と名称を構成する単語が含まれる登録用情報が記憶されている記憶部(例えば、記憶部102)で使用されている、登録用情報の管理番号が最小であること、または最大であることでもよい。
【0150】
また、所定の条件は、認識情報に対応する登録用情報が記憶部に記憶された時期が最も早いことでもよい。また、所定の条件は、認識情報に含まれる名称に対応する商品が所定の種類(例えば、季節限定メニュー)の商品であることでもよい。
【0151】
また、生成部は、認識情報に含まれる略語を、認識情報に含まれる名称を構成する単語を組み合わせることによって生成してもよい。
【0152】
そのような構成により、生成装置は、料理の名称を構成する1つの単語のみが発せられる場合にも適用可能な音声認識辞書を生成できる。
【0153】
また、生成装置20は、認識装置(例えば、音声認識装置300)に対して生成された認識情報で構成された認識辞書を送信する送信部(例えば、送信部203)を備えてもよい。
【0154】
そのような構成により、生成装置は、生成された音声認識辞書を音声認識装置に対して送信できる。
【0155】
図14は、本発明による認識システムの概要を示すブロック図である。本発明による認識システム30は、認識辞書を生成する生成装置40(例えば、音声認識辞書作成装置200)と、認識辞書を用いて認識処理を行う認識装置50(例えば、音声認識装置300)とを含む認識システムであって、生成装置40は、認識辞書を構成する認識情報であって、名称と名称の略語とを含み、略語ごとに生成された認識情報のうち、同一の略語を含み、それぞれ異なる名称に対応する認識情報に対して、少なくとも1つの認識情報を削除する削除部41(例えば、辞書作成部202)を含む。
【0156】
そのような構成により、認識システムは、同一の略語で呼ばれる可能性がある異なる名称に基づいて、変換される名称が一意に定められる音声認識辞書を生成できる。