(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6427755
(24)【登録日】2018年11月9日
(45)【発行日】2018年11月28日
(54)【発明の名称】データ入力装置、データ入力方法、プログラム及び車載機
(51)【国際特許分類】
G10L 15/06 20130101AFI20181119BHJP
G10L 15/24 20130101ALI20181119BHJP
G10L 15/22 20060101ALI20181119BHJP
G10L 15/00 20130101ALI20181119BHJP
【FI】
G10L15/06 400W
G10L15/24 R
G10L15/22 200V
G10L15/00 200Q
【請求項の数】10
【全頁数】10
(21)【出願番号】特願2014-32688(P2014-32688)
(22)【出願日】2014年2月24日
(65)【公開番号】特開2015-158563(P2015-158563A)
(43)【公開日】2015年9月3日
【審査請求日】2016年9月7日
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】100106116
【弁理士】
【氏名又は名称】鎌田 健司
(74)【代理人】
【識別番号】100170494
【弁理士】
【氏名又は名称】前田 浩夫
(72)【発明者】
【氏名】柏本 和俊
【審査官】
冨澤 直樹
(56)【参考文献】
【文献】
国際公開第2005/076259(WO,A1)
【文献】
特開2006−023572(JP,A)
【文献】
特開2010−139826(JP,A)
【文献】
特開2007−164712(JP,A)
【文献】
特開平09−016891(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00−15/34
G06F 3/16
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
文字列入力部と、
音声入力部と、
音声認識辞書を格納する辞書格納部と、
前記文字列入力部により入力された文字列から始まる複数の語句を前記音声認識辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成する辞書生成部と、
前記音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、
前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部と、
を備える、データ入力装置。
【請求項2】
表示部と、
前記表示部の表示を制御する表示制御部と、
をさらに備え、
前記表示制御部は、前記表示部に対し、前記共通語句と前記差分語句とを含む前記複数の語句を表示させるとともに、前記複数の語句のそれぞれに含まれる前記差分語句を強調して表示させる、
請求項1に記載のデータ入力装置。
【請求項3】
前記音声認識部は、前記音声に一致する前記差分語句がない場合、前記音声と前記音声認識辞書に含まれる語句とを対比して、前記音声に一致する語句があるか否かを判定し、
前記音声に一致する語句がある場合、前記入力文字列確定部は、当該語句を入力文字列として確定する、
請求項1または請求項2に記載のデータ入力装置。
【請求項4】
車両の走行状態に基づき前記文字列入力部から前記音声入力部へ切り替える入力切替部、
をさらに備える、請求項1乃至請求項3の何れか1項に記載のデータ入力装置。
【請求項5】
前記辞書生成部は、前記文字列入力部により文字が入力される度に前記動的音声認識辞書を生成する、
請求項1から請求項4の何れか1項に記載のデータ入力装置。
【請求項6】
請求項1から請求項5の何れか1項に記載された前記データ入力装置が確定した前記入力文字列を入力として動作する、
車載機。
【請求項7】
文字列入力部と、
音声入力部と、
音声認識辞書を格納する辞書格納部と、
表示部と、
前記音声認識辞書から抽出された、前記文字列入力部により入力された文字列から始まる複数の語句を前記表示部に表示させる表示制御部と、
前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と前記音声入力部により入力された音声とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、
前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部と、
を備える、データ入力装置。
【請求項8】
文字列入力部により入力された文字列から始まる複数の語句を音声認証辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成するステップと、
音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、
前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備える、
データ入力方法。
【請求項9】
音声認識辞書から抽出された、文字列入力部により入力された文字列から始まる複数の語句を表示部に表示させるステップと、
前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と音声入力部により入力された音声とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、
前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備える、
データ入力方法。
【請求項10】
請求項8または請求項9に記載のデータ入力方法をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はタッチパネル・キー操作等の手入力による文字列入力装置と音声認識機能を併用したデータ入力技術に関する。
【背景技術】
【0002】
従来の手入力による文字列入力装置と音声認識機能を併用したデータ入力装置としては、手入力により入力された文字から入力される文字列候補を予測し、予測した文字列候補に認識対象語を絞って音声認識を行うものが知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−182208号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来のデータ入力装置では、ユーザが文字列入力装置により入力した入力済みの文字列も発話しなければならなかった。
【0005】
また、文字列候補として共通語句を含む候補が多数予測された場合、予測された文字列候補に認識対象語を絞っても音声認識の精度を向上させることができないという課題があった。
【0006】
例えば、車を運転して「マクドナルド(登録商標)鴨居店」に行きたいユーザーが、車載機に「マクド」と打ち込んだところで車が発進し、以降キー入力ができないため音声入力に切り替わった場合を想定する。車載機には文字列候補として、例えば「マクドナルド(登録商標)鴨居店」「マクドナルド(登録商標)中山店」「マクドナルド(登録商標)小杉店」が表示される。
【0007】
ユーザは、「マクドナルド(登録商標)鴨居店」と入力済みの「マクド」も発話しなければならなかった。
【0008】
予測された文字列候補は共通語句である「マクドナルド(登録商標)」を含む。文字列候補の大部分が共通語句のため、文字列候補に認識対象語を絞っても音声認識の精度を向上させることはできない。
【0009】
本発明は、上記課題を解決するもので、入力済みの文字列の発話を不要とし、また、認識対象語を絞り込むことにより音声認識の精度を向上させることにある。
【課題を解決するための手段】
【0010】
上記課題を解決するために本発明のデータ入力装置は、文字列入力部と、音声入力部と、音声認識辞書を格納する辞書格納部と、前記文字列入力部により入力された文字列から始まる複数の語句を前記音声認識辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成する辞書生成部と、前記音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部とを備えた構成となっている。
また、上記課題を解決するために本発明のデータ入力装置は、文字列入力部と、音声入力部と、音声認識辞書を格納する辞書格納部と、表示部と、前記音声認識辞書から抽出された、前記文字列入力部により入力された文字列から始まる複数の語句を前記表示部に表示させる表示制御部と、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と前記音声入力部により入力された音声とを対比して、前記音声に一致する前記差分語句があるか否かを判定する音声認識部と、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定する入力文字列確定部と、を備えた構成となっている。
また、上記課題を解決するために本発明のデータ入力方法は、文字列入力部により入力された文字列から始まる複数の語句を音声認証辞書から抽出し、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句の集合から成る動的音声認識辞書を生成するステップと、音声入力部により入力された音声と前記動的音声認識辞書に含まれる前記差分語句とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備えた構成となっている。
また、上記課題を解決するために本発明のデータ入力方法は、音声認識辞書から抽出された、文字列入力部により入力された文字列から始まる複数の語句を表示部に表示させるステップと、前記複数の語句において先頭から共通する語句を共通語句として、前記複数の語句のそれぞれから前記共通語句を除いた差分語句と音声入力部により入力された音声
とを対比して、前記音声に一致する前記差分語句があるか否かを判定するステップと、前記音声に一致する前記差分語句がある場合、当該差分語句および前記共通語句を含む語句を前記複数の語句から選定して入力文字列として確定するステップと、を備えた構成となっている。
【0011】
なお、ここで文字列には、1文字も含む。音声認識辞書に格納された語句とは、音声認識の単位をなす文字列をいう。強調して表示するとは、色、太さ、大きさ、フォントを変えて表示すること、点滅表示すること、枠で囲んで表示すること、これらの組み合わせも含む。
【発明の効果】
【0012】
本発明によれば、入力済みの文字列の発話を不要とし、また、認識対象語を絞り込むことにより音声認識の精度を向上させることができる。
【図面の簡単な説明】
【0013】
【
図1】本発明の実施の形態1におけるデータ入力装置の構成と車両を示すブロック図
【
図2】本発明の実施の形態1におけるデータ入力装置を用いたデータ入力処理の一例を示すフロー図
【
図3】本発明の実施の形態1における動的音声認識辞書の生成過程の一例を示す概念図
【
図4】本発明の実施の形態1におけるデータ入力装置を用いたデータ入力時の表示画面の遷移の一例を示す図
【発明を実施するための形態】
【0014】
(実施の形態1)
以下、本発明の実施の形態を図面を参照しながら説明する。なお、実施の形態では車載機へのデータ入力として説明するが、本発明は車載機へのデータ入力に限定されるものではない。
【0015】
図1は、本発明の実施の形態1におけるデータ入力装置の構成と車両を示すブロック図である。
【0016】
図1において、データ入力装置1000は、車両1100に搭載されたカーナビゲーションシステム等の車載機1102、車両の走行状態を判定する走行状態判定部1101と接続されている。
【0017】
データ入力装置1000は、入力部として、タッチパネル、キー入力デバイス等の手入力により文字列を入力する文字列入力部1001と、マイク等の音声を入力する音声入力部1002の2つの入力部を備えている。
【0018】
入力切替部1003は、走行状態判定部1101から入力される車両の走行状態の判定結果に基づき、ユーザが使用する入力部を文字列入力部1001から音声入力部1002へ、音声入力部1002から文字列入力部1001へと切替える。
【0019】
入力文字列確定部1004は、文字列入力部1001から入力された文字列を入力文字列の一部として確定する。入力文字列確定部1004は、入力文字列の一部として確定した文字列と音声認識部1007の音声認識結果に基づき入力文字列を確定する。入力文字列確定部1004は、確定した入力文字列を車載機1102へ出力する。入力文字列確定部1004は、音声入力部1002から入力された音声を音声認識部1007へ出力し、音声認識部1007から音声認識の結果を入力する。
【0020】
動的音声認識辞書生成部1006は、入力文字列確定部1004が入力文字の一部として確定した文字列と音声認識辞書1009から動的音声認識辞書1010を生成する。
【0021】
音声認識部1007は、音声入力部1002から入力された音声を、辞書格納部1008に格納された辞書を用いて認識する。
【0022】
辞書格納部1008は、音声認識辞書1009と動的音声認識辞書1010とを格納する。音声認識辞書1009はデータ入力装置1000が予め備えている辞書である。動的音声認識辞書1010は、動的音声認識辞書生成部1006が動的に生成する辞書である。
【0023】
表示制御部1005は、表示部1016の表示を制御する。表示部1016は、表示制御部1005の制御に従い入力文字列確定部1004が確定した文字列、辞書格納部1008に格納された辞書の語句を表示する。
【0024】
車両1100に搭載された走行状態判定部は、車両の走行状態を判定し、「発進」、「停車」を含む判定結果を入力切替部1003へ出力する。車載機1102は、カーナビゲーションシステム、ディスプレイオーディオ等のデータ入力を必要とする機器である。
【0025】
以上のように構成されたデータ入力装置1000について、以下にその動作について説明する。
図2は本発明の実施の形態1におけるデータ入力装置1000を用いたデータ入力処理の一例を示す図である。
【0026】
図2において、ユーザーは文字列入力部1001を用いて文字の入力を行う(S201)。入力文字列確定部1004は、入力された文字を入力文字列の一部として確定する。
【0027】
動的音声認識辞書生成部1006は、入力文字列の一部として確定された文字列を基に、音声認識辞書1009から動的音声認識辞書1010を生成する(S202)。
【0028】
動的音声認識辞書1010は、音声認識辞書1009に格納された語句で入力文字列の一部として確定した文字列と先頭が一致する複数の語句から、複数の語句に共通する共通語句を除いた差分語句を格納した辞書である。動的音声認識辞書1010の生成に関しては、後に図面を用いて説明する。
【0029】
入力文字列確定部1004は、音声入力モードか否かを判定する(S203)。音声入力モードとは、入力切替部1003が、入力部を文字列入力部1001から音声入力部1002に切り替えた状態をいう。
【0030】
音声入力モードでない場合(S203でNOの場合)、S201からS202を繰り返す。動的音声認識辞書生成部1006は、文字が入力され、入力文字列の一部が更新される度に動的音声認識辞書1010を生成する。
【0031】
音声入力モードの場合(S203でYESの場合)、表示制御部1005は、入力文字列確定部1004が入力文字列の一部として確定した文字列と先頭が一致する音声認識辞書の語句(以後、入力文字列候補と称す)を表示部1016に表示する(S204)。
【0032】
表示制御部1005は、入力文字列候補のうち、動的音声認識辞書1010に格納された差分語句を強調して表示する。表示制御部1005は、音声入力モードであることを表示部1016に表示する。表示制御部1005は、文字列入力部1001から文字を入力できないことを表示部1016に示す。
【0033】
ユーザは入力文字列を確定するために必要な語句を発話する(S205)。
【0034】
ユーザの発話は音声入力部1002から音声認識部1007へ入力される。音声認識部1007は、動的音声認識辞書1010を用いて発話の認識を行う。音声認識部1007は、動的音声認識辞書1010に格納された差分語句とユーザが発話した語句とのマッチングを行う(S206)。
【0035】
ユーザの発話を認識できた場合、即ち、ユーザが発話した語句と差分語句とがマッチした場合(S207でYESの場合)、入力文字列確定部1004は、ユーザが発話した語句とマッチした差分語句を含む入力文字列候補を入力文字列として確定する(S210)。
【0036】
ユーザの発話を認識できない場合、即ち、ユーザが発話した語句と差分語句とがマッチしない場合(S207でNOの場合)、音声認識部1007は、音声認識辞書1009を用いて発話の認識を行う。音声認識部1007は、音声認識辞書1009に格納された語句とユーザが発話した語句とのマッチングを行う(S208)。
【0037】
ユーザの発話を認識できた場合(S209でYESの場合)、入力文字列確定部1004は、認識結果と入力文字列の一部として確定した文字列に基づき入力文字列を確定する。
【0038】
ユーザの発話を認識できない場合(S209でNOの場合)、S205からの処理を繰り返す。
【0039】
図3は、動的音声認識辞書1010の生成過程の一例を示す概念図である。
図3において語句301は、音声認識辞書1009に格納された語句の一例である。音声認識辞書1009には、「イロハニホ鴨居店」等、具体的店舗名を表す語句が格納されている。動的音声認識辞書1010を用いない従来の音声認識は、これらの語句とユーザが発話した語句とのマッチングを行う。
【0040】
語句302は、文字列入力部1001から文字列「イロハ」が入力された時に、動的音声認識辞書生成部1006が、音声認識辞書1009に格納された語句301から抽出した語句である。
【0041】
動的音声認識辞書生成部1006は、音声認識辞書1009に格納された語句から文字列入力部1001から入力された文字列と先頭が一致する語句を抽出する。抽出された語句「イロハニホ鴨居店」「イロハニホ中山店」「イロハニホ新横店」「イロハニホ小杉店」は、入力された文字列「イロハ」と先頭が一致する語句である。
【0042】
動的音声認識辞書生成部1006は、抽出した語句302を複数の語句に共通する共通語句3021「イロハニホ」と共通語句を除いた差分語句3022とに分ける。動的音声認識辞書生成部1006は、差分語句3022のみを格納した新たな辞書、動的音声認識辞書1010を生成する。語句303は、音声認識辞書1009に格納された語句301から生成した動的音声認識辞書1010に格納された語句の一例である。
【0043】
図4は、本発明の実施の形態1におけるデータ入力装置を用いたデータ入力時の表示画面の遷移の一例を示す図である。
【0044】
表示部1016を液晶表示パネル、文字列入力部1001を液晶表示パネルと重ねて配
置されたタッチパネルとして説明するが、表示部1016、文字列入力部1001は、これらに限定されるものではない。
【0045】
表示画面401は、文字列入力部1001に相当するタッチパネル入力部4012と、タッチパネル入力部4012から入力された文字列を表示する入力文字列表示部4011を有している。入力文字列表示部4011に表示された文字は、入力文字列の一部として入力文字列確定部1004が確定した文字列である。
【0046】
ユーザーは車両を運転中かつ停車中であり、近場の「イロハニホ」チェーン店へのルート案内を所望しているものとする。
図4の表示画面402は、ユーザーがタッチパネル入力部4011から、「イロハ」まで文字列を入力した入力途中の表示画面である。
【0047】
ユーザが車両を発進すると、走行状態判定部1101は判定結果として「発進」を入力切替部1003に出力する。入力切替部1003は、入力部を文字列入力部1001から音声入力部1002へ切替える。表示画面402は、表示画面403へと遷移する。
【0048】
表示画面403には、入力文字列候補4031が表示される。入力文字列候補4031は、入力文字列確定部1004が入力文字列の一部として確定した文字列「イロハ」と先頭が一致する音声認識辞書1009に格納された語句である。入力文字列候補4031は、複数の語句で共通する共通語句「イロハニホ」と差分語句「鴨居店」「中山点」「新横店」「小杉店」等からなる。入力文字列候補4031は、差分語句が太字で強調表示される。ユーザが入力文字列を確定するために、強調表示された差分語句のみを発話すればよいことを示している。
【0049】
表示画面403は、タッチパネル入力部4012の表示なくし、タッチパネル入力部4012から文字を入力できないことを示している。
【0050】
表示画面403には、入力部が音声入力に切替ったこと、音声入力モードであることを示すマイクアイコン4032が表示される。
【0051】
表示画面403の表示中に、ユーザが「鴨居店」と発話すれば、音声認識部1007は動的音声認識辞書1010を用いて発話の認識を行う。音声認識部1007は発話された語句を「鴨居店」と認識する。入力文字列確定部1004は、音声認識の認識結果である「鴨居店」を含む文字列入力候補「イロハニホ鴨居店」を入力文字列として確定する。入力文字列確定部1004は、確定した文字列「イロハニホ鴨居店」を車載機1102へ出力する。
【0052】
以上のように本発明の実施の形態1におけるデータ入力装置、およびデータ入力方法によれば、共通語句を除いた差分語句を格納した動的音声認識辞書を用いて音声認識を行うことにより、入力済みの語句の発話を不要とし、また、認識対象語を共通語句を取り除いた差分語句に絞り込むことにより音声認識の精度を向上させることができる。
【0053】
なお、実施の形態1では、1文字も文字列と称している。強調表示として太字を説明したが、色、大きさ、フォントを変えて表示すること、点滅表示すること、枠で囲んで表示すること、これらを組み合わせて表示するものであってもよい。
【0054】
また、文字列入力部1001、表示部1016を車載機が備える入力装置、出力装置と兼用する構成としてもよい。
【0055】
また、本発明の実施の形態1にかかわるデータ入力装置は、専用のハードウェアによっ
て実現される他に、その機能を実現するためのプログラムをコンピュータが読み取り可能な記録媒体に記録し、この記憶媒体に記録されたプログラムをコンピュータシステムに読み込ませて、実行するものであってもよい。
【産業上の利用可能性】
【0056】
本発明のデータ入力装置及びデータ入力方法は、カーナビゲーションシステム等の車載機へのデータ入力装置及びデータ入力方法として有用である。
【符号の説明】
【0057】
1000 データ入力装置
1001 文字列入力部
1002 音声入力部
1004 入力文字列確定部
1006 動的音声認識辞書生成部
1016 表示部
1010 動的音声認識辞書
1102 車載機
3021 共通語句
3022 差分語句