(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6100101
(24)【登録日】2017年3月3日
(45)【発行日】2017年3月22日
(54)【発明の名称】音声認識を利用した候補選択装置および候補選択方法
(51)【国際特許分類】
G10L 15/22 20060101AFI20170313BHJP
G06F 3/16 20060101ALI20170313BHJP
【FI】
G10L15/22 200H
G06F3/16 650
【請求項の数】5
【全頁数】10
(21)【出願番号】特願2013-117525(P2013-117525)
(22)【出願日】2013年6月4日
(65)【公開番号】特開2014-235356(P2014-235356A)
(43)【公開日】2014年12月15日
【審査請求日】2016年2月29日
(73)【特許権者】
【識別番号】000101732
【氏名又は名称】アルパイン株式会社
(74)【代理人】
【識別番号】100105784
【弁理士】
【氏名又は名称】橘 和之
(72)【発明者】
【氏名】大谷 教明
【審査官】
上田 雄
(56)【参考文献】
【文献】
特開2009−250779(JP,A)
【文献】
特開2002−091492(JP,A)
【文献】
特開2000−250587(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00−15/34
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
リスト表示されたものの中からユーザが発話した対象候補またはこれに付与された候補番号の何れかを音声認識することによって対象候補を選択可能になされた候補選択装置であって、
上記リスト表示される対象候補が上記候補番号の数字を表す文字列であるか否かを判定する文字列判定部と、
上記リスト表示される対象候補が上記候補番号の数字を表す文字列であると上記文字列判定部により判定された場合、上記対象候補の数字と上記候補番号の数字とが一致するように、上記対象候補と上記候補番号とを対応付ける対応付け部と、
上記対応付け部により対応付けられた上記対象候補と上記候補番号とをその対応付けに従ってリスト表示させる表示制御部と、
上記表示制御部によりリスト表示されたものの中からユーザが発話した上記対象候補または上記候補番号を音声認識する音声認識部とを備えたことを特徴とする音声認識を利用した候補選択装置。
【請求項2】
上記対応付け部は、上記候補番号の数字を表す文字列に該当する対象候補が存在しない場合に、その数字の候補番号には何も対象候補を対応付けず、上記候補番号の数字と一致する数字を表す文字列の対象候補のみを、数字が一致する上記候補番号に対応付けることを特徴とする請求項1に記載の音声認識を利用した候補選択装置。
【請求項3】
上記対応付け部は、上記候補番号の数字を表す文字列に該当する対象候補が存在しない場合に、その数字の候補番号に対して、上記候補番号の数字以外を表す文字列の対象候補を対応付けることを特徴とする請求項1に記載の音声認識を利用した候補選択装置。
【請求項4】
上記候補番号の数字を表す文字列に該当する対象候補は、道路番号、街区符号または住居番号の少なくとも1つであることを特徴とする請求項1に記載の音声認識を利用した候補選択装置。
【請求項5】
リスト表示されたものの中からユーザが発話した対象候補またはこれに付与された候補番号の何れかを音声認識することによって対象候補を選択可能になされた候補選択方法であって、
コンピュータの文字列判定部が、上記リスト表示される対象候補が上記候補番号の数字を表す文字列であるか否かを判定する第1のステップと、
上記リスト表示される対象候補が上記候補番号の数字を表す文字列であると上記文字列判定部により判定された場合、上記コンピュータの対応付け部が、上記対象候補の数字と上記候補番号の数字とが一致するように、上記対象候補と上記候補番号とを対応付ける第2のステップと、
上記コンピュータの表示制御部が、上記対応付け部により対応付けられた上記対象候補と上記候補番号とをその対応付けに従ってリスト表示させる第3のステップと、
上記コンピュータの音声認識部が、上記表示制御部によりリスト表示されたものの中からユーザが発話した上記対象候補または上記候補番号を音声認識する第4のステップとを有することを特徴とする音声認識を利用した候補選択方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識を利用した候補選択装置および候補選択方法に関し、特に、リスト表示されたものの中からユーザが発話した対象候補またはこれに付与された候補番号の何れかを音声認識することによって対象候補を選択可能になされた候補選択装置に用いて好適なものである。
【背景技術】
【0002】
車両の殆どには、オーディオ装置、エアーコンディショナ、ナビゲーション装置など各種の電子機器が搭載されている。従来、これらの電子機器を操作する際の片手運転等を回避するために、電子機器の操作を音声認識により行えるようにしたシステムが提供されている。
【0003】
音声認識システムは通常、ユーザが発声した特定の単語や熟語、簡単な命令文などを発話コマンドとして認識し、その認識結果を電子機器のアプリケーションに供給する。これに応じてアプリケーションは、認識結果に応じた制御を行う。例えば、ナビゲーション装置のアプリケーションとして目的地の住所検索を実行する場合、音声認識により特定した住所をナビゲーション装置に入力し、これを施設の検索キーとして設定することが可能である。
【0004】
従来、
図8に示すように、ユーザが住所などを音声認識により設定する際、音声認識の対象としてリスト表示した複数の候補のそれぞれに対して候補番号を付与し、ユーザが候補番号を発話することで、候補番号に対応する対象候補を選択可能にした技術が提案されている(例えば、特許文献1参照)。また、候補番号の発話に加え、対象候補の名称等を直接発話することによっても対象候補を選択可能にした技術も提案されている。例えば、
図8の例で“Florida”を選択したい場合、6番目の候補番号を“シックス”と発話するか、対象候補の名称を“フロリダ”と発話すれば、“Florida”を選択することができる。
【0005】
しかしながら、
図9に示すように、例えば米国の住所におけるStreet Number(またはHouse Number)のように数字の対象候補に対して候補番号を割り当てる場合、リスト表示された複数の対象候補に対して上から順番に昇順の候補番号を割り当てるため、候補番号とStreet Number(対象候補)の数字とが一致しないことがある。
【0006】
この場合、音声認識システムでは、ユーザの発話した数字が候補番号なのかStreet Number(対象候補)なのかを判別することができず、誤認識が発生するという問題があった。例えば、
図9の例でユーザが“ファイブ”と発話した場合、音声認識システムは、リストの5番目にある“7”を指すのか、リストの4番目にある“5”を指すのかを判別することができない。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2000−250587号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は、このような問題を解決するために成されたものであり、リスト表示された対象候補またはこれに付与された候補番号の何れかを発話することで対象候補を選択可能になされたシステムにおいて、対象候補として数字を表す文字列がリスト表示される場合に、ユーザが選択しようとする対象候補を常に正しく音声認識できるようにすることを目的とする。
【課題を解決するための手段】
【0009】
上記した課題を解決するために、本発明では、リスト表示される対象候補が候補番号の数字を表す文字列である場合、対象候補の数字と候補番号の数字とが一致するように対象候補と候補番号とを対応付け、その対応付けに従ってリスト表示させるようにしている。
【発明の効果】
【0010】
上記のように構成した本発明によれば、リスト表示されたものの中からユーザが対象候補または候補番号の何れかを選んで発話した場合、対象候補を発話しても候補番号を発話しても数字が一致しているので、ユーザの発話した数字が候補番号なのか対象候補なのかを装置において判別することは不要で、ユーザは音声認識によって正しい対象候補を選択することができる。
【図面の簡単な説明】
【0011】
【
図1】本実施形態による音声認識を利用した候補選択装置の機能構成例を示すブロック図である。
【
図2】本実施形態の対応付け部によって行われる対応付けの内容を説明するための図である。
【
図3】本実施形態の対応付け部によって行われる対応付けの内容を説明するための図である。
【
図4】本実施形態の表示制御部により表示される候補番号と対象候補のリスト表示の一例を示す図である。
【
図5】本実施形態による候補選択装置の動作例を示すフローチャートである。
【
図6】本実施形態の表示制御部により表示される候補番号と対象候補のリスト表示の変形例を示す図である。
【
図7】本実施形態の表示制御部により表示される候補番号と対象候補のリスト表示の変形例を示す図である。
【発明を実施するための形態】
【0012】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本実施形態による音声認識を利用した候補選択装置の機能構成例を示すブロック図である。
図1に示すように、本実施形態の候補選択装置は、その機能構成として、対象候補抽出部11、文字列判定部12、対応付け部13、表示制御部14、発話音声入力部15および音声認識部16を備えている。
【0013】
上記各機能ブロック11〜16は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック11〜16は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。
【0014】
対象候補抽出部11は、候補データベース21の中から、リスト表示させる複数の対象候補を抽出する。例えば、本実施形態の候補選択装置をナビゲーション装置に適用する場合、候補データベース21は地図データベースである。また、住所に基づいて所望の施設を検索して目的地に設定する場合、対象候補抽出部11は、都道府県から市区町村の行政区画の名称、町名(○○x丁目)、街区符号(xx番)、住居番号(xx号)を対象候補として順次抽出していく。
【0015】
すなわち、対象候補抽出部11は、最初は都道府県の名称を対象候補として候補データベース21から抽出する。抽出された複数の対象候補は、後述するように表示制御部14によってディスプレイ22にリスト表示される。リスト表示された複数の対象候補の中から何れかがユーザにより音声認識によって選択されると、次に対象候補抽出部11は、選択された都道府県に属する市区町村の名称を候補データベース21から次の対象候補として抽出する。
【0016】
ここで抽出された市区町村に関する複数の対象候補は、先に表示されていた都道府県の対象候補に代えてディスプレイ22にリスト表示される。そして、その中から何れかがユーザにより選択されると、次に対象候補抽出部11は、選択された市区町村に属する町名を対象候補として抽出する。以下同様にして、対象候補抽出部11は、ユーザによる対象候補の選択状態に応じて、街区符号、住居番号を順次抽出していく。なお、例えば米国仕様の地図データベースの場合、対象候補には道路番号も含まれる。
【0017】
文字列判定部12は、対象候補抽出部11により抽出された対象候補が候補番号の数字を表す文字列であるか否かを判定する。候補番号の数字を表す文字列に該当する対象候補は、道路番号、街区符号、住居番号である。また、本実施形態では、リストには6個の対象候補を表示するようになっている。この場合、文字列判定部12は、リスト表示される対象候補が道路番号、街区符号、住居番号の何れかであって、かつ、その番号が“1”〜“6”の何れかである場合に、対象候補が候補番号の数字を表す文字列であると判定する。
【0018】
なお、町名が「○○x丁目」のような形態で対象候補とされるのではなく、「○○」の部分と「x丁目」の部分とを分離してそれぞれ別個の対象候補とされ、「x丁目」の部分が単に数字の「x」としてリスト表示される場合、「x」の値が“1”〜“6”の何れかであれば、文字列判定部12は対象候補が候補番号の数字を表す文字列であると判定する。
【0019】
対応付け部13は、“1”〜“6”の6個の候補番号と、当該6個の候補番号に対してリスト表示される6個の対象候補とを対応付ける。
図2および
図3は、対応付け部13によって行われる対応付けの内容を説明するための図である。例えば、
図8のようなリスト表示をする場合、対応付け部13は、
図2に示すように対応付けを行う。
【0020】
本実施形態では、リスト表示されたものの中からユーザが発話した候補番号または対象候補の何れかを音声認識することによって対象候補を選択可能になされている。そのため、対応付けは、
図2(a)に示すような候補番号に対する認識IDの対応付けと、
図2(b)に示すような対象候補に対する認識IDの対応付けとの2つをもって行う。
【0021】
ここで、認識IDは、音声認識部16が音声認識の結果として出力する識別情報である。
図2に示す例の場合、例えばユーザが“ワン”と発話しても、“カリフォルニア”と発話しても、音声認識部16は認識結果を表す認識IDとして“ID1”を出力することになる。
【0022】
対応付け部13は、リスト表示される対象候補が候補番号の数字を表す文字列であると文字列判定部12により判定された場合、対象候補の数字と候補番号の数字とが一致するように、対象候補と候補番号とを対応付ける。この対応付けの内容を示したのが
図3である。
【0023】
図3(a)は、“1”〜“6”の6個の候補番号と“ID1”〜“ID6”の6個の認識IDとを対応付けるものであり、
図2(a)の内容と同じになっている。リスト表示される対象候補をスクロールさせても候補番号を“1”〜“6”に固定しておく仕様の場合、候補番号と認識IDとの対応付けの内容は常に固定で変化しない。
【0024】
図3(b)は、候補番号の数字を表す文字列に該当する対象候補(道路番号、街区符号、住居番号など)と認識IDとを対応付けた状態を示している。
図3(b)に示す例において、候補番号の数字を表す文字列に該当する対象候補は、“1”、“2” 、“3”、“5”の4つである。この場合、対応付け部13は、対象候補の数字と候補番号の数字とが一致するように、“1”、“2” 、“3”、“5”の4つの対象候補に対して“ID1”、“ID2” 、“ID3”、“ID5”の4つの認識IDを対応付ける。
【0025】
この
図3(b)の例において、候補番号の数字で“4”と“6”を表す文字列の対象候補は存在しない。この場合、対応付け部13は、対象候補が存在しない数字に対応する認識IDには何も対象候補を対応付けない。すなわち、候補番号の数字と一致する数字を表す文字列の対象候補“1”、“2” 、“3”、“5”のみを“ID1”、“ID2” 、“ID3”、“ID5”の認識IDに対応付けるようにする。
【0026】
表示制御部14は、対応付け部14により対応付けられた対象候補と候補番号とをその対応付けに従ってディスプレイ22にリスト表示させる。例えば、対応付け部13によって
図2のように対応付けが行われた場合、表示制御部14は、
図8のように6個の対象候補を6個の候補番号“1”〜“6”に対応付けてリスト表示させる。また、対応付け部13によって
図3のように対応付けが行われた場合、表示制御部14は、
図4のように4個の対象候補“1”、“2” 、“3”、“5”を4個の候補番号“1”、“2” 、“3”、“5”に対応付けてリスト表示させる。
【0027】
発話音声入力部15は、表示制御部14によりリスト表示されたものの中からユーザが発話した対象候補または候補番号の音声を図示しないマイクから入力する。音声認識部16は、発話音声入力部15により入力された発話音声を音声認識し、認識した対象候補または候補番号に対して対応付け部13により対応付けられた認識IDを音声認識の結果として出力する。
【0028】
図5は、以上のように構成した本実施形態による候補選択装置の動作例を示すフローチャートである。なお、
図5に示すフローチャートは、ナビゲーション装置のアプリケーションとして、音声認識を利用して目的地の住所検索を行うことが指定されたときに開始する。
【0029】
まず、対象候補抽出部11は、候補データベース21の中から、ディスプレイ22にリスト表示させる複数の対象候補を抽出する(ステップS1)。そして、文字列判定部12は、対象候補抽出部11により抽出された対象候補が候補番号の数字を表す文字列であるか否かを判定する(ステップS2)。すなわち、文字列判定部12は、対象候補が道路番号、街区符号、住居番号の何れかであって、かつ、その番号が“1”〜“6”の何れかに該当するか否かを判定する。
【0030】
ここで、リスト表示される対象候補が候補番号の数字を表す文字列であると文字列判定部12により判定された場合、対応付け部13は、対象候補の数字と候補番号の数字とが一致するように、対象候補と候補番号とを対応付ける(ステップS3)。一方、リスト表示される対象候補が候補番号の数字を表す文字列ではないと文字列判定部12により判定された場合、対応付け部13は、対象候補と候補番号とを所定のルールに従って対応付ける(ステップS4)。例えば、複数の対象候補を50音順あるいはアルファベット順に並べて、昇順の候補番号にそれぞれ対応付ける。
【0031】
次に、表示制御部14は、ステップS3またはステップS4の何れかにおいて対応付け部14によって対応付けられた対象候補と候補番号とを、その対応付けに従ってディスプレイ22にリスト表示させる(ステップS5)。この状態で、音声認識部16は、ユーザによる発話音声が発話音声入力部15により入力されたか否かを判定する(ステップS6)。
【0032】
発話音声の入力があった場合、音声認識部16は、ユーザが発話した対象候補または候補番号を音声認識し、認識した対象候補または候補番号に対応付けられている認識IDを音声認識の結果として出力する(ステップS7)。その後、対象候補抽出部11は、目的地の検索キーとする住所の設定を終了するための操作が行われたか否かを判定する(ステップS8)。住所の設定を終了するための操作とは、例えば住所検索の実行ボタンの操作である。
【0033】
住所検索の実行ボタンが操作されていない場合、処理はステップS1に戻る。この場合、対象候補抽出部11は、ステップS7で出力された音声認識の結果を受けて、認識された対象候補の下位層に属する複数の対象候補(例えば、認識された対象候補が都道府県である場合は、その都道府県に属する市区町村の対象候補)を抽出する。以降、上述と同様の処理を行う。一方、住所検索の実行ボタンが操作された場合、
図5に示すフローチャートの処理は終了する。
【0034】
以上詳しく説明したように、本実施形態では、ディスプレイ22にリスト表示される対象候補が候補番号の数字を表す文字列である場合、対象候補の数字と候補番号の数字とが一致するように対象候補と候補番号とを対応付け、その対応付けに従ってリスト表示させるようにしている。
【0035】
このように構成した本実施形態によれば、リスト表示されたものの中からユーザが対象候補または候補番号の何れかを選んで発話した場合、対象候補を発話しても候補番号を発話しても数字が一致しているので、ユーザの発話した数字が候補番号なのか対象候補なのかを音声認識部16において判別することは不要で、ユーザは音声認識によって正しい対象候補を選択することができる。また、誤認識の発生を防止することができるだけでなく、ユーザとっても候補番号なのか対象候補なのかを気にすることなく発話することができるので、使い勝手が向上する。
【0036】
なお、上記実施形態では、候補番号の数字を表す文字列に該当する対象候補が存在しない場合に、その数字の候補番号には何も対象候補を対応付けない例について説明したが、本発明はこれに限定されない。例えば、
図6に示すように、候補番号の数字を表す文字列の対象候補が存在しない場合に、その数字の候補番号に対して、候補番号の数字以外を表す文字列の対象候補を対応付けるようにしてもよい。
【0037】
また、上記実施形態では、候補番号の数字を表す対象候補の文字列が数字そのもので表される例について説明したが、本発明はこれに限定されない。例えば、
図7に示すように、対象候補の文字列が数字を表す単語により表されていてもよい。あるいは、対象候補の文字列が数字の読みにより表されていてもよい。
【0038】
また、上記実施形態では、候補番号の数字を“1”〜“6”に固定する例について説明したが、本発明はこれに限定されない。例えば、対象候補をスクロールさせて表示させたときに、そのスクロールに合わせて候補番号の数字もスクロールさせて可変とするようにしてもよい。
【0039】
また、上記実施形態では、ナビゲーション装置の住所検索を実行するアプリケーションを例に挙げて説明したが、オーディオ装置の楽曲検索(特に楽曲名検索)など、これ以外のアプリケーションに本発明を適用することも可能である。
【0040】
その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0041】
11 対象候補抽出部
12 文字列判定部
13 対応付け部
14 表示制御部
15 発話音声入力部
16 音声認識部