(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023029982
(43)【公開日】2023-03-07
(54)【発明の名称】操作入力方法、操作入力システムおよび操作端末
(51)【国際特許分類】
G06F 3/16 20060101AFI20230228BHJP
G10L 15/22 20060101ALI20230228BHJP
【FI】
G06F3/16 650
G06F3/16 620
G10L15/22 460Z
【審査請求】有
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022195657
(22)【出願日】2022-12-07
(62)【分割の表示】P 2018199677の分割
【原出願日】2018-10-24
(71)【出願人】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】藤井 亮太
(57)【要約】
【課題】ユーザが手を用いた操作を行うことが難しい状況等でも、ユーザ操作の入力時の利便性を向上する。
【解決手段】操作入力方法は、操作端末に第1の画面が表示された状態でユーザの発する音声を収音し、収音された音声を認識し、認識結果が第1の画面に示される確認項目に対する入力内容と合致するか否かを判断し、認識結果が第1の画面に示される確認項目に対する入力内容と合致する場合、第1の画面から第2の画面への表示の切り替えを操作端末に指示し、操作端末に第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数)が表示された状態でユーザの発する認識結果が第m番目の画面に示される確認項目に対する入力内容と合致するか否かを判断し、認識結果が第m番目の画面に示される確認項目に対する入力内容と合致する場合、第m番目の画面から第(m+1)番目の画面への表示の切り替えを操作端末に指示する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
操作端末に第1の画面が表示された状態でユーザの発する音声を収音するステップと、
収音された前記音声を認識するステップと、
前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致するか否かを判断するステップと、
前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致する場合、前記第1の画面から第2の画面への表示の切り替えを前記操作端末に指示するステップと、
前記操作端末に第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数)が表示された状態で前記ユーザの発する音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致するか否かを判断するステップと、
前記音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致する場合、前記第m番目の画面から第(m+1)番目の画面への表示の切り替えを前記操作端末に指示するステップと、を有する、
操作入力方法。
【請求項2】
前記第1の画面に示される確認項目に対応する前記音声の認識結果を表示する、
請求項1に記載の操作入力方法。
【請求項3】
前記第mの画面に示される確認項目に対応する前記音声の認識結果を表示する、
請求項1または2に記載の操作入力方法。
【請求項4】
音声入力装置および表示装置を有する操作端末と、音声処理装置とが通信可能に接続された操作入力システムであって、
前記操作端末は、前記表示装置に第1の画面を表示した状態で前記音声入力装置によりユーザの発する音声を収音し、
前記操作端末または前記音声処理装置は、収音された前記音声を認識し、
前記音声処理装置は、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致するか否かを判断し、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致する場合、前記第1の画面から第2の画面への表示の切り替えを前記操作端末に指示し、
前記音声処理装置は、前記操作端末に第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数)が表示された状態で前記ユーザの発する音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致するか否かを判断し、前記音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致する場合、前記第m番目の画面から第(m+1)番目の画面への表示の切り替えを前記操作端末に指示する、
操作入力システム。
【請求項5】
表示装置に第1の画面を表示した状態でユーザの発する音声を収音する音声入力装置と、
収音された前記音声を認識する認識部と、
前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致するか否かを判断する制御部と、を備え、
前記制御部は、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致する場合、前記第1の画面から第2の画面への表示の切り替えを前記表示装置に指示し、
前記制御部は、前記表示装置に第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数)が表示された状態で前記ユーザの発する音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致するか否かを判断し、前記音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致する場合、前記第m番目の画面から第(m+1)番目の画面への表示の切り替えを前記表示装置に指示する、
操作端末。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音声を用いて操作する操作入力方法、操作入力システムおよび操作端末に関する。
【背景技術】
【0002】
特許文献1には、住所に対応する入力音声に対して音声認識処理を行うことで、住所を構成する複数の単語のそれぞれに対応する第1候補を決定し、決定された複数の単語のそれぞれに対応する複数の第1候補を利用者に提示する音声認識装置が開示されている。音声認識装置は、認識結果を提示した後に利用者からの認識結果修正指示を受け付けると、誤認識があった単語に対応する入力音声に対して再度の音声認識処理を行うことで、この単語に対応する第1候補を除く第2候補を決定する。これにより、住所を音声入力する際の発話回数を減らせることができ、利用者の操作の簡略化が可能となる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1の構成では、例えば誤認識された単語があった場合に利用者からの認識結果修正指示はバックスイッチを押下する等の処理が求められるため、利用者の手を用いた操作が必要となる。このため、例えば利用者が手を使えない状況にある場合等においては、認識結果の修正を行うことができず、円滑な処理を進行できない点で利用者の利便性が低下するという課題があった。
【0005】
本開示は、上述した従来の状況に鑑みて案出され、ユーザが手を用いた操作を行うことが難しい状況等でも、ユーザ操作の入力時の利便性を向上する操作入力方法、操作入力システムおよび操作端末を提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示は、操作端末に第1の画面が表示された状態でユーザの発する音声を収音するステップと、収音された前記音声を認識するステップと、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致するか否かを判断するステップと、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致する場合、前記第1の画面から第2の画面への表示の切り替えを前記操作端末に指示するステップと、前記操作端末に第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数)が表示された状態で前記ユーザの発する音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致するか否かを判断するステップと、前記音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致する場合、前記第m番目の画面から第(m+1)番目の画面への表示の切り替えを前記操作端末に指示するステップと、を有する、操作入力方法を提供する。
【0007】
また、本開示は、音声入力装置および表示装置を有する操作端末と、音声処理装置とが通信可能に接続された操作入力システムであって、前記操作端末は、前記表示装置に第1の画面を表示した状態で前記音声入力装置によりユーザの発する音声を収音し、前記操作端末または前記音声処理装置は、収音された前記音声を認識し、前記音声処理装置は、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致するか否かを判断し、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致する場合、前記第1の画面から第2の画面への表示の切り替えを前記操作端末に指示し、前記音声処理装置は、前記操作端末に第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数)が表示された状態で前記ユーザの発する音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致するか否かを判断し、前記音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致する場合、前記第m番目の画面から第(m+1)番目の画面への表示の切り替えを前記操作端末に指示する、操作入力システムを提供する。
【0008】
また、本開示は、表示装置に第1の画面を表示した状態でユーザの発する音声を収音する音声入力装置と、収音された前記音声を認識する認識部と、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致するか否かを判断する制御部と、を備え、前記制御部は、前記音声の認識結果が前記第1の画面に示される確認項目に対する入力内容と合致する場合、前記第1の画面から第2の画面への表示の切り替えを前記表示装置に指示し、前記制御部は、前記表示装置に第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数)が表示された状態で前記ユーザの発する音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致するか否かを判断し、前記音声の認識結果が前記第m番目の画面に示される確認項目に対する入力内容と合致する場合、前記第m番目の画面から第(m+1)番目の画面への表示の切り替えを前記表示装置に指示する、操作端末を提供する。
【発明の効果】
【0009】
本開示によれば、ユーザが手を用いた操作を行うことが難しい状況等でも、ユーザ操作の入力時の利便性を向上できる。
【図面の簡単な説明】
【0010】
【
図1】実施の形態1に係る操作入力システムの構成の概略を示す図
【
図2】操作端末および音声処理装置のハードウェア構成を示すブロック図
【
図3】キーワードデータベースの登録内容を示すテーブル
【
図5】実施の形態1に係る音声認識の動作手順例を示すシーケンス図
【
図6】
図5に続く音声認識の動作手順例を示すシーケンス図
【
図7】表示装置に表示された点検結果画面の一例を示す図
【
図8】実施の形態1の変形例1に係る音声認識の動作手順例を示すフローチャート
【
図9】
図8に続く音声認識の動作手順例を示すフローチャート
【
図10】実施の形態2に係る表示装置の音声入力画面の遷移を示す図
【
図11】操作入力システムにおける音声認識手順を示すシーケンス図
【
図12】
図11に続く操作入力システムにおける音声認識手順を示すシーケンス図
【
図13】実施の形態2の変形例1に係る音声認識手順を示すフローチャート
【発明を実施するための形態】
【0011】
以下、適宜図面を参照しながら、本開示に係る操作入力方法、操作入力システムおよび操作端末の構成および作用を具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0012】
(実施の形態1)
図1は、実施の形態1に係る操作入力システム5の構成の概略を示す図である。操作入力システム5は、操作端末10を携帯する利用者(ユーザ)が発する音声を認識し、この音声認識結果に対応する情報を表示する。操作入力システム5は、アクセスポイント40を介してネットワークNWに接続される操作端末10と、ネットワークNWに接続された音声処理装置50とを含む構成である。
【0013】
アクセスポイント40は、操作端末10を無線でネットワークNWに接続する機器である。ネットワークNWは、有線LAN(Local Area Network)、無線LAN、あるいはインターネット等の広域ネットワークである。
【0014】
操作端末10は、複数の利用者によって共用される端末であり、音声入力および表示可能なタブレット端末で構成される。タブレット端末には、入力された音声データをそのまま音声処理装置50に送信するためのアプリケーション、入力された音声を認識してテキストデータに変換するためのアプリケーション、このテキストデータを音声処理装置50に送信するためのアプリケーションがそれぞれインストールされている。なお、操作端末10は、タブレット端末の他に、同様な情報処理能力および通信機能を有する電子機器であるスマートフォン、ノート型PC(Personal Computer)あるいはPDA(Personal Digital Assistant)等のコンピュータ端末でもよい。
【0015】
音声処理装置50は、汎用のコンピュータで構成される。音声処理装置50は、操作端末10から送信された音声データを基に、音声を認識してテキストデータに変換し、また、このテキストデータに対応する表示情報を取得してあるいは画面データを生成して操作端末10に送信する。なお、音声処理装置50は、テキストデータに変換することなく、音声データに対応する表示情報を取得してあるいは画面データを生成して操作端末10に送信してもよい。
【0016】
図2は、操作端末10および音声処理装置50のハードウェア構成を示すブロック図である。操作端末10は、プロセッサ11と、メモリ12と、通信回路13と、音声入力装置14と、表示装置15とを含む構成である。
【0017】
プロセッサ11は、例えばCPU(Central Processing Unit)、DSP(Digital Signal Processor)あるいはFPGA(Field Programmable Gate Array)を用いて構成され、操作端末10の各部の動作を制御する。プロセッサ11は、操作端末10の制御部として機能し、操作端末10の各部の動作を全体的に統括するための制御処理、操作端末10の各部との間のデータの入出力処理、データの演算(計算)処理およびデータの記憶処理を行う。プロセッサ11は、メモリ12内のROM(Read Only Memory)に記憶されたプログラムの実行に従って動作する。
【0018】
また、プロセッサ11は、機能的な構成として音声認識部25を有する。音声認識部25は、メモリ12内のROMに記憶されたプログラムの実行に従って構成されるソフトウェア的な構成要素であり、音声入力装置14で入力された音声を認識し、テキストデータに変換する。プロセッサ11は、画面データを基に、表示装置15に各種情報を表示する。また、プロセッサ11は、音声入力を促進するための音声の候補を表示装置15に表示する。プロセッサ11は、表示装置15に表示するための画面データを生成する。
【0019】
メモリ12は、例えばRAM(Random Access Memory)とROM(Read Only Memory)を含み、操作端末10の動作の実行に必要なプログラムやデータ、動作中に生成された情報またはデータ等を一時的に保存する。RAMは、例えばプロセッサ11の動作時に使用されるワークメモリである。ROMは、例えばプロセッサ11を制御するためのプログラムおよびデータを予め記憶する。また、メモリ12には、社員ID(Identification Number)、および各社員IDに対応する複数の点検項目が登録されたキーワードテーブル12zが記憶されている(
図3参照)。
【0020】
通信回路13は、ネットワークNWを介して音声処理装置50との間で通信可能な通信回路、あるいはその通信回路が実装されたNIC(Network Interface Card)により構成される。
【0021】
音声入力装置14は、音声を収音するマイクにより構成される。マイクとしては、指向性を有するマイク、無指向性のマイクのいずれでもよい。
【0022】
表示装置15は、プロセッサ11の指示に従い、音声処理装置50から送信された画面データを表示する。なお、操作端末10が画面データを生成する場合、表示装置15は、プロセッサ11が生成した画面データを表示する。なお、表示装置15は、タッチ入力操作可能なタッチパネルで構成されてもよい。
【0023】
音声処理装置50は、プロセッサ51と、メモリ52と、通信回路53と、ストレージ54とを含む構成である。
【0024】
メモリ52は、例えばRAM(Random Access Memory)とROM(Read Only Memory)を含み、音声処理装置50の動作の実行に必要なプログラムやデータ、動作中に生成された情報またはデータ等を一時的に保存する。RAMは、例えばプロセッサ51の動作時に使用されるワークメモリである。ROMは、例えばプロセッサ51を制御するためのプログラムおよびデータを予め記憶する。
【0025】
通信回路53は、ネットワークNWを介して操作端末10との間で通信可能な通信回路、あるいはその通信回路が実装されたNIC(Network Interface Card)により構成される。
【0026】
ストレージ54は、大容量の記憶媒体であり、例えば音声データ、音声認識結果、およびキーワードデータベース(DB)541等を記憶する。
【0027】
キーワードDB541には、全社員ID、および各社員IDに対応する複数の点検項目が登録されている。
【0028】
プロセッサ51は、例えばCPU(Central Processing Unit)、DSP(Digital Signal Processor)あるいはFPGA(Field Programmable Gate Array)を用いて構成され、音声処理装置50の各部の動作を制御する。プロセッサ51は、音声処理装置50の制御部として機能し、音声処理装置50の各部の動作を全体的に統括するための制御処理、音声処理装置50の各部との間のデータの入出力処理、データの演算(計算)処理およびデータの記憶処理を行う。プロセッサ51は、メモリ52内のROM(Read Only Memory)に記憶されたプログラムの実行に従って動作する。
【0029】
プロセッサ51は、機能的な構成として制御部61と、音声認識部62と、キーワードマッチング部63とを有する。これらの各部は、プロセッサ51が内蔵メモリあるいはメモリ52に記憶された制御プログラムを実行することで実現される機能である。
【0030】
音声認識部62は、メモリ52内のROMに記憶されたプログラムの実行に従って構成されるソフトウェア的な構成要素であり、操作端末10から送信された音声データの音声を認識してテキストデータに変換する。なお、操作端末10から、音声データの代わりに、既に音声認識された結果であるテキストデータが送信される場合、音声認識部62による音声認識処理は省略される。
【0031】
キーワードマッチング部63は、メモリ52内のROMに記憶されたプログラムの実行に従って構成されるソフトウェア的な構成要素であり、音声認識結果であるテキストとキーワードDB541に登録されているキーワードとを照合する。例えば、音声認識されたテキストが番号またはその羅列(数列)である場合、キーワードマッチング部63は、この番号とキーワードDB541に登録されている社員IDとを照合し、一致している場合、利用者がこの社員IDを持つ社員であることを認証する。社員IDの認証が成功した場合、キーワードマッチング部63は、この社員IDに対応する1つまたは複数の点検項目をピックアップ(抽出)する。キーワードマッチング部63は、この利用者が次に発する音声を点検項目の順番(チェック番号)に該当させる。例えば、社員IDが「123456」である場合、その社員IDの社員が実行するべき点検項目として、エンジンの確認と、ブレーキディスクの確認と、アクセルペダルの確認と、バッテリチェックの確認等とが予め定義されておりピックアップされる。キーワードマッチング部63は、この点検項目の順番を、利用者が発する音声の発話順と判断する。
【0032】
制御部61は、メモリ52内のROMに記憶されたプログラムの実行に従って構成されるソフトウェア的な構成要素であり、音声認識結果およびチェック番号の点検項目を含む画面データを生成し、操作端末10に送信する。また、制御部61は、音声認識結果およびチェック番号の点検項目をストレージ54に記憶する。
【0033】
図3は、キーワードデータベース(DB)541の登録内容を示すテーブルである。キーワードデータベース(DB)541には、例えば、社員IDが「123456」に対応する点検項目として、チェック1:エンジンの確認と、チェック2:ブレーキディスクの確認と、チェック3:アクセルペダルの確認と、チェック4:バッテリの確認等とが予め定義されて登録されている。
【0034】
また、社員IDが「789123」に対応する点検項目として、チェック1:エンジンオイルの確認と、チェック2:クーラントの確認と、チェック3:ブレーキオイルの確認と、チェック4:燃料量の確認等とが予め定義されて登録されている。
【0035】
図4は、表示装置15の音声入力画面の遷移を示す図である。操作端末10は、起動後、表示装置15に社員IDの入力画面GA1を表示する。社員IDの入力画面GA1には、「社員IDの入力」のメッセージms1と、その下方に入力ボックスbx1とが表示される。操作端末10は、音声入力装置14において利用者が発する音声を収音し、その音声に含まれる数字を社員IDとして受け付ける。
図4の例では、利用者が「123456」という音声を発したことで、その音声の認識結果である「123456」が入力ボックスbx1に入力されている。
【0036】
操作端末10は、社員IDの音声の認識結果を受け付けると、その社員IDに対応する社員が予め登録された社員であるか否かを認証等し、その認証が成功した場合にその社員IDに対応する点検項目の入力画面GA2を表示する。入力画面GA2の上方には、直前の入力画面GA1の表示時に収音された利用者の音声の認識によって入力された社員IDが表示される。入力画面GA2には、点検項目ごとに、チェック番号1,2,3,N(
図4の例では、N=4)、点検内容ct1,ct2,ct3,ct4、および入力ボックスby1,by2,by3,by4のそれぞれが順に対応付けられて表示される。なお、Nは4以上の正の整数である。
【0037】
チェック番号1~Nは、例えば利用者が点検を終える度に発する発話の順番に対応する。一例として、チェック1の点検内容は、エンジンの確認である。入力ボックスby1には、利用者が車両(図示略)内に搭載されたエンジンの点検確認結果として発話された音声「OK」の認識結果(テキストデータ)が入力される。
【0038】
同様に、チェック2の点検内容は、ブレーキディスクの確認である。入力ボックスby2には、利用者が車両内に搭載されたブレーキディスクの点検確認結果として発話された音声「OK」の認識結果(テキストデータ)が入力される。
【0039】
チェック3の点検内容は、アクセルペダルの確認である。入力ボックスby3には、利用者が車両内に搭載されたアクセルペダルの点検確認結果として発話された音声「OK」の認識結果(テキストデータ)が入力される。
【0040】
チェック4の点検内容は、バッテリの確認である。入力ボックスby4には、例えば車両内に搭載されたバッテリの確認結果として利用者によってバッテリ電圧が低いと判断された場合に利用者により発話された音声「NG」の認識結果(テキストデータ)が入力される。
【0041】
次に、実施の形態1に係る操作入力システム5の動作手順について説明する。
【0042】
以下の説明を分かり易くするため、一例として、点検対象物(例えば車両)を点検する作業者の手が塞がれている状態で、作業者が車両の点検結果を記録する例をユースケースとして説明する。手が塞がれている状態として、例えば点検終了後、作業者が使用していた工具を片付けていたり、手を洗ったりしている等の状況が想定される。また、素手によるタッチ操作で入力可能なタッチパネルを有する操作端末に対し、作業者が手袋をはめている状況が想定される。
【0043】
図5および
図6は、音声認識の動作手順例を示すシーケンス図である。
【0044】
図5において、利用者による電源オン操作によって操作端末10が起動すると、操作端末10のプロセッサ11は、音声認識の動作を開始する。プロセッサ11は、社員IDの入力画面GA1を表示装置15に表示する(T1)。社員IDの入力画面GA1が表示された状態で、利用者が音声(例えば、番号「123456」)を発する。プロセッサ11は、音声入力装置14で利用者の発話を収音する(T2)。プロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、この音声データを音声処理装置50に送信する(T3)。
【0045】
音声処理装置50のプロセッサ51の制御部61は、通信回路53を介して操作端末10から送信された音声データを受信し、メモリ52にこの音声データを記憶する。プロセッサ51の音声認識部62は、メモリ52に記憶された音声データに対し音声認識を行う(T4)。
【0046】
プロセッサ51のキーワードマッチング部63は、音声認識されたテキストデータが該当する項目(社員IDの入力項目)に対する入力であるかを判断する(T5)。この判断では、キーワードマッチング部63は、ストレージ54に記憶されたキーワードDB541を参照し、音声認識されたテキストデータに対応する社員IDの有無を判定し、利用者の社員IDを認証する。さらに、キーワードマッチング部63は、社員IDの認証結果がOKである場合、キーワードDB541に登録されている、社員IDに対応する複数の点検項目をピックアップする。
【0047】
制御部61は、社員IDの認証OK、および社員IDに対応する複数の点検項目を基に、点検項目の入力画面GA2の画面データを生成する(T6)。制御部61は、通信回路53およびネットワークNWを介して、点検項目の入力画面GA2の画面データを操作端末10に送信する(T7)。
【0048】
なお、社員IDの認証結果がNGである場合、音声処理装置50の制御部61は、操作端末10から再度の音声データの受信を待つ。このとき、制御部61は、利用者の社員IDが認証できない旨を操作端末10に返信してもよいし、何も返信しなくてもよい。また、キーワードDB541に、社員IDに対応する点検項目が登録されていない場合、制御部61は、利用者の社員IDに対応する点検項目が登録されていない旨を操作端末10に返信してもよいし、何も返信しなくてもよい。
【0049】
操作端末10のプロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、音声処理装置50から点検項目の入力画面GA2の画面データを受信し、点検項目の入力画面GA2を表示装置15に表示する(T8)。なお、プロセッサ11は、音声入力装置14で利用者の発話を収音してからしばらく経過しても、音声処理装置50から点検項目の入力画面GA2の画面データを受信しなかった場合、手順T2に戻って同様の処理を繰り返してもよい。これにより、利用者は、再度、社員IDを発話でき、突発的な騒音等によりうまく収音できなかった場合に対処できる。
【0050】
表示装置15に点検項目の入力画面GA2が表示された状態で、プロセッサ11は、手順T2と同様、音声入力装置14で利用者の発話を収音する(T9)。このとき、利用者は、チェック1(ここでは、エンジンの確認)の点検項目に対し、例えば「OK」、「NG」等を発音する。プロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、この音声データを音声処理装置50に送信する(T10)。音声処理装置50の制御部61は、通信回路53を介して操作端末10から送信された音声データを受信し、メモリ52にこの音声データを記憶する。音声認識部62は、メモリ52に記憶された音声データに対し音声認識を行う(T11)。
【0051】
制御部61は、音声認識されたテキストデータが前の入力項目(社員IDの入力項目)に対する入力であるか否かを判断する(T12)。音声認識されたテキストデータが社員IDの入力項目に対する入力である場合、つまり6桁の数字である場合、制御部61は、通信回路53およびネットワークNWを介して、この社員IDのテキストデータを操作端末10に送信する(T13)。操作端末10のプロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、音声処理装置50から社員IDのテキストデータを受信すると、この受信が社員IDの訂正であると判断し、訂正された社員IDのテキストデータを反映するように、点検項目の入力画面GA2を更新する(T14)。
【0052】
一方、手順T12で音声認識されたテキストデータが社員IDの入力項目に対する入力でない場合、制御部61は、音声認識されたテキストデータが該当する項目(チェック1の点検項目)に対する入力(例えば「OK」)であるか否かを判別する(T15)。音声認識されたテキストがチェック1の点検項目に対する入力でない場合、制御部61は、手順T11に戻り、再度、音声データを受信するまで待つ。
【0053】
一方、手順T15で音声認識されたテキストデータがチェック1の点検項目に対する入力である場合、制御部61は、通信回路53およびネットワークNWを介して、チェック1の点検項目に対するテキストデータを操作端末10に送信する(T16)。操作端末10のプロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、音声処理装置50からチェック1の点検項目に対するテキストデータを受信し、このテキストデータを反映するように、点検項目の入力画面GA2を更新する(T17)。更新された点検項目の入力画面GA2では、チェック1のエンジンの確認に対する入力ボックスby1に「OK」の文字が表示される(
図4参照)。手順T9~手順T17までの同様の処理は、点検項目の数に相当するN回分繰り返される。つまり、点検項目の番号(チェック番号)を第k番目の点検項目で表すと、手順T9~手順T17までの同様の処理は、k=1~Nで行われる。
【0054】
その後、表示装置15にチェック(N-1)の点検項目が入力済みである、つまりチェックNの入力画面GA2が表示された状態で、プロセッサ11は、手順T9と同様、音声入力装置14で利用者の発話を収音する(T18)。プロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、この音声データを音声処理装置50に送信する(T19)。音声処理装置50の制御部61は、通信回路53を介して操作端末10から送信された音声データを受信し、メモリ52にこの音声データを記憶する。音声認識部62は、メモリ52に記憶された音声データに対し音声認識を行う(T20)。
【0055】
制御部61は、音声認識されたテキストデータが前の点検項目(チェック(N-1)の点検項目)に対する入力であるか否かを判別する(T21)。例えば、利用者がキーワードとして「前の項目 NG」と発話した場合、前の入力項目に対する入力であると判断される。
【0056】
音声認識されたテキストデータがチェック(N-1)の点検項目に対する入力である場合、制御部61は、通信回路53およびネットワークNWを介して、訂正されたチェック(N-1)のテキストデータを操作端末10に送信する(T22)。操作端末10のプロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、音声処理装置50から訂正されたチェック(N-1)のテキストデータを受信すると、このテキストデータを反映するように、点検項目の入力画面GA2を更新する(T23)。
【0057】
一方、手順T21で音声認識されたテキストデータがチェック(N-1)の点検項目に対する入力でない場合、制御部61は、音声認識されたテキストデータが該当する項目(ここでは、チェックNの点検項目)に対する入力(例えば「OK」)であるかを判断する(T24)。音声認識されたテキストデータがチェックNの点検項目に対する入力でない場合、制御部61は、手順19で音声データを受信するまで待つ。
【0058】
一方、手順T21で音声認識されたテキストがチェックNの点検項目に対する入力である場合、制御部61は、点検結果画面GA3(
図7参照)を生成する(T25)。制御部61は、通信回路53およびネットワークNWを介して、点検結果画面GA3の画面データを操作端末10に送信する(T26)。操作端末10のプロセッサ11は、通信回路13、アクセスポイント40およびネットワークNWを介して、音声処理装置50から点検結果画面GA3の画面データを受信し、表示装置15に点検結果画面GA3を表示する(T27)。
【0059】
図7は、表示装置15に表示された点検結果画面GA3の一例を示す図である。点検結果画面GA3には、社員ID、点検日時、およびチェック1~Nの点検結果が一覧で表示される。
図7では、社員ID:123456、点検日時:2018年○月○日,チェック1:エンジンの確認 OK,チェック2:ブレーキディスクの確認 OK,チェック3:アクセルぺダルの確認 OK,チェック4:バッテリの確認 NG等が表示される。
【0060】
このように、実施の形態1の操作入力システムでは、社員IDの入力から点検項目の確認、点検結果画面の表示に至るまでの操作を、利用者の手を必要とすることなく簡単な発話だけで完結できる。特に、チェック番号を発音することなく、チェックの順番を発話順に合わせることができ、発話回数が少なくて済む。これにより、発話による操作が簡単になる。また、発話順によらず、入力する単語の形式(例えば4桁の数字)が他の単語の形式(例えば2文字のアルファベット)と異なる場合、入力対象を特定する項目名を省略できるようにしてもよい。
【0061】
なお、前の点検項目の確認を訂正する場合、利用者が「前の項目 NG 」と発話する場合を例示したが、これに限らず、「チェック番号○〇 NG」と発話してもよい。チェック番号を入力することで、2つ以上前のチェック番号の入力を訂正することも可能となる。また、入力操作に使用される、利用者が発する簡単な単語としては、番号、OK、NGに限らず、肯定を表すYES,否定を表すNO,ランクを表すA,B,C等であってもよい。これにより、入力ミスが少なくなる。
【0062】
以上により、実施の形態1の操作入力方法は、操作端末10に社員IDの入力画面GA1(第1の画面)が表示された状態で利用者(ユーザ)の発する音声を収音するステップと、収音された前記音声を認識するステップと、音声の認識結果が社員IDの入力画面GA1に示される点検項目(確認項目)に対する入力内容と合致するか否かを判断するステップと、音声の認識結果が社員IDの入力画面GA1に示される社員IDの入力項目に対する入力内容と合致する場合、社員IDの入力画面GA1から点検項目の入力画面GA2(第2の画面)への表示の切り替えと、社員IDの入力画面GA1に示される社員IDの入力項目に対応する音声の認識結果の点検項目の入力画面GA2への表示とを操作端末10に指示するステップと、を有する。
【0063】
これにより、操作入力方法、操作入力システム5、あるいは操作端末10によれば、ユーザが手を用いた操作を行うことが難しい状況(作業者の手が塞がれている状態)等でも、作業者が車両の点検結果を記録するために操作端末10に対して音声を発するという簡易な作業で点検を効率的に行えるので、ユーザ操作の入力時の利便性を向上できる。
【0064】
また、操作入力方法は、操作端末10にN(N:4以上の整数)個の点検項目の入力画面GA2が表示された状態でユーザの発する音声の認識結果が点検項目の入力画面GA2に示される第k(k:1≦k≦(N-1)を満たす整数)番目の点検項目に対する入力内容と合致するか否かを判断するステップと、音声の認識結果が点検項目の入力画面GA2に示される第k番目の点検項目に対する入力内容と合致する場合、第k番目の点検項目に対応する音声の認識結果の点検項目の入力画面GA2への表示を操作端末10に指示するステップと、を有する。これにより、点検項目の連続的な入力が可能となり、操作性が向上する。
【0065】
また、音声を認識するステップは、音声の認識結果が点検項目の入力画面GA2に示される第k番目の点検項目に対する入力内容と合致しない場合、利用者が発話した「前の項目NG」、「チェック3 NO」等のキーワード(所定のキーワード)と第k番目の点検項目に対して利用者が再度発する音声との認識処理を受け付けるステップを含む。これにより、一旦、入力が完了した後でも、前の点検項目の入力内容を簡単に訂正できる。
【0066】
また、音声の認識結果が点検項目の入力画面GA2に示される第N番目の点検項目に対する入力内容と合致する場合、N個の点検項目とそれぞれの点検項目に対するユーザの発する音声の認識結果とを対応付けた点検結果画面GA3(認識結果)の表示を操作端末10に指示するステップ、を更に有する。これにより、ユーザは、全ての点検項目の入力内容を一覧で視覚的に確認できる。したがって、ユーザは、誤入力を見つけ易くなり、入力ミスの低減を図ることができる。
【0067】
また、点検項目の入力画面GA2に示されるチェック1(第1番目)からチェックN(第N番目)までの点検項目に対する入力内容は、社員IDの入力画面GA1に示される社員IDの入力項目に対する入力内容と対応付けられる。これにより、社員IDごとに点検項目を管理できる。また、ユーザは、点検項目の入力画面GA2に示された点検項目の入力内容と自身が想定している点検項目の内容とを比較し、その正誤を容易に確認できる。
【0068】
また、利用者が発話した「前の項目 NG」、「チェック3 NO」等のキーワード(所定のキーワード)は、1つ前の点検項目(第k-1番目の確認項目)に対する入力内容の訂正(修正)を表すテキストデータ(情報)である。これにより、1つ前の点検項目を簡単に訂正できる。
【0069】
(実施の形態1の変形例1)
実施の形態1では、音声処理装置50が操作端末10から音声データを受信して音声認識を行う場合を示したが、実施の形態1の変形例1では、操作端末10が音声認識を行う例を説明する。
【0070】
図8および
図9は、実施の形態1の変形例1に係る音声認識の動作手順例を示すフローチャートである。
【0071】
図8において、利用者による電源オンの操作等によって操作端末10が起動すると、操作端末10のプロセッサ11は、音声認識の動作を開始する。プロセッサ11は、社員IDの入力画面GA1を表示装置15に表示する(S1)。社員IDの入力画面GA1が表示された状態で、利用者が音声(例えば、番号「123456」)を発する。プロセッサ11は、音声入力装置14で利用者の発話を収音する(S2)。
【0072】
プロセッサ11は、収音された音声の音声データをメモリ12に記憶する。プロセッサ11の音声認識部25は、メモリ12に記憶された音声データに対し音声認識を行い、音声を認識できたか否かを判別する(S3)。音声を認識できなかった場合、プロセッサ11は、ステップS2に戻り、再度、収音動作を行う。これにより、利用者は、再度、社員IDの発話でき、突発的な騒音等によりうまく収音できなかった場合に対処できる。
【0073】
ステップS3で音声を認識できた場合、プロセッサ11は、音声認識されたテキストデータが該当する項目(社員IDの入力項目)に対する入力であるか否かを判別する(S4)。社員IDの入力項目に対する入力である場合、プロセッサ11は、メモリ12に記憶されたキーワードテーブル12zを参照し、音声認識されたテキストに対応する社員IDの有無を判定し、利用者の社員IDを認証する。さらに、プロセッサ11は、社員IDの認証結果がOKである場合、キーワードテーブル12zに登録されている、社員IDに対応する複数の点検項目をピックアップする。
【0074】
ステップS4で社員IDの入力項目に対する入力でない場合、プロセッサ11は、ステップS2に戻り、再度、収音動作を行う。社員IDの入力項目に対する入力でない場合として、例えば、社員IDの認証結果がNGであることや、キーワードテーブル12zに利用者の社員IDに対応する点検項目が登録されていないことが挙げられる。なお、これらの場合、プロセッサ11は、社員IDの認証結果がNGである旨を表示装置15に表示してもよい。また、プロセッサ11は、利用者の社員IDに対応する点検項目が登録されていない旨を表示装置15に表示してもよい。
【0075】
プロセッサ11は、社員IDの認証OK、および社員IDに対応する複数の点検項目を基に、点検項目の入力画面GA2を生成する(S5)。プロセッサ11は、点検項目の入力画面GA2を表示装置15に表示する(S6)。
【0076】
表示装置15に点検項目の入力画面GA2が表示された状態で、プロセッサ11は、ステップS2と同様、音声入力装置14で利用者の発話を収音する(S7)。このとき、利用者は、チェック1のエンジンの確認の点検項目に対し、例えば「OK」、「NG」等を発音する。
【0077】
プロセッサ11は、収音された音声の音声データをメモリ12に記憶する。プロセッサ11の音声認識部25は、メモリ12に記憶された音声データに対し音声認識を行い、音声を認識できたか否かを判別する(S8)。音声を認識できなかった場合、プロセッサ11は、ステップS7に戻り、再度、収音動作を行う。
【0078】
ステップS8で音声を認識できた場合、プロセッサ11は、音声認識されたテキストデータが該当する項目(チェック1の点検項目)に対する入力であるか否かを判別する(S9)。音声認識されたテキストデータがチェック1の点検項目に対する入力でない場合、プロセッサ11は、音声認識されたテキストデータが前の入力項目(社員IDの入力項目)に対する入力であるか否かを判別する(S10)。社員IDの入力項目に対する入力でない場合、プロセッサ11は、ステップS8の処理に戻る。なお、社員IDの入力項目に対する入力でない場合、プロセッサ11は、何も表示しなくてよいし、再入力を促すように表示装置15に表示してもよい。
【0079】
ステップS10で音声認識されたテキストデータが社員IDの入力項目に対する入力である場合、つまり6桁の数字である場合、プロセッサ11は、この入力が社員IDの訂正であると判断し、訂正された社員IDを反映するように、点検項目の入力画面GA2を更新する(S11)。この後、プロセッサ11は、ステップS7の処理に戻る。
【0080】
ステップS9で音声認識されたテキストデータがチェック1の点検項目に対する入力である場合、プロセッサ11は、チェック1の点検項目に対するテキストデータを反映するように(チェック1の入力の音声認識結果を含むように)、点検項目の入力画面GA2を更新する(S12)。更新された点検項目の入力画面GA2では、チェック1のエンジンの確認に対する入力ボックスby1に「OK」の文字が表示される(
図4参照)。
【0081】
ステップS7~S12までの同様の処理は、点検項目の数に相当するN回分繰り返される。つまり、点検項目の番号(チェック番号)を第k番目の点検項目で表すと、ステップS7~S12までの同様の処理は、k=1~Nで行われる。
【0082】
プロセッサ11は、表示装置15にチェック(N-1)の項目が入力済みである点検項目の入力画面GA2を表示する(S13)。プロセッサ11は、この表示状態で、ステップS7と同様、音声入力装置14で利用者の発話を収音する(S14)。プロセッサ11は、収音された音声の音声データをメモリ12に記憶する。プロセッサ11の音声認識部25は、メモリ12に記憶された音声データに対し音声認識を行い、音声認識できたか否かを判別する(S15)。音声認識できなかった場合、プロセッサ11は、ステップS14に戻り、再度、利用者の発話を取得する。
【0083】
プロセッサ11は、音声認識されたテキストデータが該当する項目(チェックNの点検項目)に対する入力(例えば「OK」)であるかを判別する(S16)。音声認識されたテキストデータがチェックNの点検項目に対する入力でない場合、例えば、利用者が「前の項目 NG」と発話した場合、プロセッサ11は、音声認識されたテキストデータが前の点検項目(チェック(N-1)の点検項目)に対する入力であるか否かを判別する(S17)。
【0084】
音声認識されたテキストデータがチェックN-1の入力項目に対する入力である場合、プロセッサ11は、訂正されたチェック(N-1)のテキストデータを反映するように、点検項目の入力画面GA2を更新する(S18)。この後、プロセッサ11は、ステップS14の処理に戻る。なお、ステップS17で音声認識されたテキストデータがチェックN-1の点検項目に対する入力でない場合、プロセッサ11は、ステップS14の処理に戻る。このとき、プロセッサ11は、何も表示しなくてよいし、再入力を促すように、表示装置15に表示してもよい。
【0085】
ステップS16で音声認識されたテキストデータがチェックNの点検項目に対する入力である場合、プロセッサ11は、点検結果画面GA3(
図7参照)を生成する(S19)。プロセッサ11は、表示装置15に点検結果画面GA3を表示する(S20)。この後、プロセッサ11は音声認識の動作を終了する。
【0086】
以上により、実施の形態1の変形例1に係る操作端末10は、利用者が発話すると、自機で音声認識を行い、音声認識結果を表示する。したがって、ネットワーク環境が無い場所で操作端末を使用できる。ネットワーク環境を使用しない、また、音声処理装置を必要としないことで、低コスト化を図ることができる。
【0087】
(実施の形態2)
実施の形態1では、点検項目の入力操作は一画面内で順番に行われたが、実施の形態2では、点検項目ごとに画面が遷移して入力操作が行われる場合を示す。実施の形態2の操作入力システム5の構成は実施の形態1に係る操作入力システム5の構成とほぼ同一の構成を有する。従って、実施の形態1と同一の構成要素については同一の符号を用いることで、その説明を簡略化あるいは省略し、異なる内容について説明する。
【0088】
図10は、実施の形態2に係る表示装置15の音声入力画面の遷移を示す図である。操作端末10は、起動後、実施の形態1と同様、表示装置15に社員IDの入力画面GA1を表示する。社員IDの入力画面GA1には、「社員IDの入力」のメッセージms1、およびその下方に入力ボックスbx1が表示される。操作端末10は、音声入力装置14で利用者が発する音声を収音し、音声に含まれる数字を社員IDとして受け付ける。
図10の例では、利用者が「123456」という音声を発したことで、その音声の認識結果である「123456」が入力ボックスbx1に入力されている。
【0089】
操作端末10は、社員IDの音声の認識結果を受け付けると、その社員IDに対応する社員が予め登録された社員であるか否かを認証等し、その認証が成功した場合に、音声処理装置50から画面データを受信し、チェック1の点検項目の入力画面GA12を表示する。入力画面GA12の上側には、直前の入力画面GA1の表示時に収音された利用者の音声の認識によって入力された社員IDが表示される。入力画面GA12の下側には、チェック1、点検内容ct1、点検結果ef1がそれぞれ表示される。チェック1の点検内容は、エンジンの確認である。点検結果は、「OK」または「OK」である。
【0090】
操作端末10は、チェック1の点検結果が確認されると、音声処理装置50から画面データを受信し、チェック2の点検項目の入力画面GA13を表示する。入力画面GA13の上側には、前の入力画面GA12で入力されたチェック1の結果が表示される。入力画面GA13の下側には、チェック2、点検内容ct2、および点検結果が表示される。チェック2の点検内容は、ブレーキディスクの確認である。点検結果は、「OK」または「OK」である。以後、チェックNの入力画面まで同様に画面遷移が行われる。
【0091】
次に、実施の形態2に係る操作入力システム5の動作手順について説明する。
【0092】
実施の形態2においても、実施の形態1と同様に、点検対象物(例えば車両)を点検する作業者の手が塞がれている状態で、作業者が車両の点検結果を記録する例をユースケースとして説明する。
図11および
図12は、操作入力システム5における音声認識手順を示すシーケンス図である。実施の形態1と同様の手順については、同一の手順番号を付すことでその説明を省略する。
【0093】
図11において、手順T5で音声認識されたテキストデータが社員IDの入力項目に対する入力である場合、制御部61は、チェック1の点検項目の画面GA12を生成する(T6A)。制御部61は、チェック1の画面データを操作端末10に送信する(T7A)。操作端末10のプロセッサ11は、受信した画面データを基に、チェック1の点検項目の入力画面GA12を表示する(T8A)。
【0094】
手順T12で音声認識されたテキストデータが社員IDの入力項目に対する入力である場合、つまり6桁の数字である場合、音声処理装置50の制御部61は、訂正された社員IDを含むチェック1の点検項目の入力画面GA12を生成する(T12A)。制御部61は、通信回路53およびネットワークNWを介して、訂正されたチェック1の点検項目の入力画面GA12の画面データを操作端末10に送信する(T13A)。操作端末10のプロセッサ11は、受信した画面データを基に、チェック1の点検項目の入力画面GA12を更新する(T14A)。
【0095】
また、手順T15で音声認識されたテキストデータがチェック1の点検項目に対する入力である場合、音声処理装置50の制御部61は、チェック1の確認結果を含むチェック2の点検項目の入力画面GA13を生成する(T15A)。制御部61は、通信回路53およびネットワークNWを介して、チェック2の点検項目の入力画面GA13の画面データを操作端末10に送信する(T16A)。操作端末10のプロセッサ11は、受信した画面データを基に、チェック2の点検項目の入力画面GA13を更新する(T17A)。
【0096】
手順T9~手順T17Aまでの同様の処理は、点検項目の入力画面の数回分繰り返される。つまり、点検項目の入力画面を第m番目の画面(m=2~N)で表すと、手順T9~手順T17Aまでの同様の処理は、m=2~Nで行われる。
【0097】
その後、手順T21で音声認識されたテキストデータがチェック(N-1)の点検項目に対する入力である場合、音声処理装置50の制御部61は、訂正されたチェック(N-1)の入力を含むチェックNの点検項目の入力画面を生成する(T21A)。制御部61は、通信回路53およびネットワークNWを介して、訂正されたチェック(N-1)の入力を含むチェックNの点検項目の入力画面の画面データを操作端末10に送信する(T22)。操作端末10のプロセッサ11は、受信した画面データを基に、手順T24でチェックNの点検項目の入力画面を更新する(T23)。
【0098】
また、手順T21で音声認識されたテキストデータがチェックNの点検項目に対する入力である場合、音声処理装置50の制御部61は、手順T25でチェックNの確認結果を含む点検結果画面GA3(
図7参照)の画面データを生成する。以後の動作は、実施の形態1と同様であるため、説明を省略する。
【0099】
このように、実施の形態2の操作入力システム5では、利用者の手を必要とすることなく入力操作を完結できる。点検項目が変わる度に、表示装置に表示される点検項目の入力画面が変化するので、利用者が視覚的に分かり易い入力操作を行うことができる。また、利用者は、点検項目が多い場合でも、次に点検する内容を即座に把握できる。
【0100】
以上により、実施の形態2の操作入力方法は、操作端末10に例えばチェック1の点検項目の入力画面GA12(第m番目の画面(2≦m≦Nを満たす整数、N:4以上の整数))が表示された状態でユーザの発する音声の認識結果が入力画面GA12に示されるチェック1の点検項目に対する入力内容と合致するか否かを判断するステップと、音声の認識結果が入力画面GA12に示されるチェック1の点検項目に対する入力内容と合致する場合、入力画面GA12(第m番目の画面)からチェック2の点検項目の入力画面GA13(第(m+1)番目の画面)への表示の切り替えと、入力画面GA12に示されるチェック1の点検項目に対応する音声の認識結果のチェック2の点検項目の入力画面GA13への表示とを操作端末10に指示するステップと、を有する。
【0101】
これにより、点検項目の連続的な入力が可能となり、操作性が向上する。また、画面が切り替わることで、ユーザが次の点検項目の入力操作に移行したことに気付き易くなる。
【0102】
また、音声を認識するステップは、音声の認識結果が入力画面GA12に示されるチェック1の点検項目(第m番目の画面に示される確認項目)に対する入力内容と合致しない場合、利用者が発話した「前の項目 NG」、「チェック3 NO」等のキーワード(所定のキーワード)とチェック1の点検項目に対してユーザが再度発する音声との認識処理を受け付けるステップを含む。これにより、一旦、入力が完了した後でも、前の項目の入力内容を簡単に訂正できる。
【0103】
また、音声の認識結果が点検結果画面GA3(第N番目の画面)に示される点検項目に対する入力内容と合致する場合、入力画面GA12(第2番目の画面)から第N番目の画面までのそれぞれの点検項目とそれぞれの点検項目に対するユーザの発する音声の認識結果とを対応付けた点検結果画面GA3(認識結果)の表示を操作端末10に指示するステップ、を更に有する。これにより、ユーザは、全ての点検項目の入力内容を一覧で視覚的に確認できる。誤入力を見つけ易くなり、入力ミスの低減を図ることができる。
【0104】
また、入力画面GA12である第2番目の入力画面から第N番目の入力画面までに示される点検項目に対する入力内容は、社員IDの入力画面GA1に示される点検項目に対する入力内容と対応付けられる。これにより、社員IDごとに点検項目を管理できる。また、ユーザは、各点検項目の入力画面GA12,GA13に示された点検項目の入力内容と自身が想定している点検項目の内容とを比較し、その正誤を容易に確認できる。
【0105】
また、利用者が発話した「前の項目 NG」、「チェック3 NO」等のキーワード(所定のキーワード)は、1つ前の画面(第m-1番目の画面)に示される点検項目に対する入力内容の訂正(修正)を表すテキストデータ(情報)である。これにより、1つ前の点検項目を簡単に訂正できる。
【0106】
(実施の形態2の変形例1)
実施の形態2では、音声処理装置50が操作端末10から音声データを受信して音声認識を行う場合を示したが、実施の形態2の変形例1では、操作端末10が音声認識を行う例を説明する。実施の形態2の変形例1に係る操作端末10は、実施の形態1と同一の構成を有する。実施の形態1と同一の構成要素については同一の符号を用いることで、その説明を省略する。
【0107】
図13および
図14は、実施の形態2の変形例1に係る音声認識の動作手順例を示すフローチャートである。実施の形態1の変形例1と同一のステップ処理については同一のステップ番号を付す。
【0108】
図13において、利用者による電源オンの操作等によって操作端末10が起動すると、操作端末10のプロセッサ11は、音声認識の動作を開始する。プロセッサ11は、社員IDの入力画面GA1を表示装置15に表示する(S1)。社員IDの入力画面GA1が表示された状態で、利用者が音声(例えば、番号「123456」)を発する。プロセッサ11は、音声入力装置14で利用者の発話を収音する(S2)。
【0109】
プロセッサ11は、収音された音声の音声データをメモリ12に記憶する。プロセッサ11の音声認識部25は、メモリ12に記憶された音声データに対し音声認識を行い、音声を認識できたか否かを判別する(S3)。音声を認識できなかった場合、プロセッサ11は、ステップS2に戻り、再度、収音動作を行う。これにより、利用者は、再度、社員IDの発話でき、突発的な騒音等によりうまく収音できなかった場合に対処できる。
【0110】
ステップS3で音声を認識できた場合、プロセッサ11は、音声認識されたテキストデータが該当する項目(社員IDの入力項目)に対する入力であるか否かを判別する(S4)。社員IDの入力項目に対する入力である場合、プロセッサ11は、メモリ12に記憶されたキーワードテーブル12zを参照し、音声認識されたテキストに対応する社員IDの有無を判定し、利用者の社員IDを認証する。さらに、プロセッサ11は、社員IDの認証結果がOKである場合、キーワードテーブル12zに登録されている、社員IDに対応する複数の点検項目をピックアップする。
【0111】
ステップS4で社員IDの入力項目に対する入力でない場合、プロセッサ11は、ステップS2に戻り、再度、収音動作を行う。社員IDの入力項目に対する入力でない場合として、例えば、社員IDの認証結果がNGであることや、キーワードテーブル12zに利用者の社員IDに対応する点検項目が登録されていないことが挙げられる。なお、これらの場合、プロセッサ11は、社員IDの認証結果がNGである旨を表示装置15に表示してもよい。また、プロセッサ11は、利用者の社員IDに対応する点検項目が登録されていない旨を表示装置15に表示してもよい。
【0112】
プロセッサ11は、社員IDの認証OK、および社員IDに対応する複数の点検項目を基に、チェック1の点検項目の入力画面GA12を生成する(S5A)。プロセッサ11は、チェック1の点検項目の入力画面GA12を表示装置15に表示する(S6A)。チェック1の点検項目の入力画面GA12には、社員IDの入力画面GA1で入力された社員IDが表示される。
【0113】
表示装置15に点検項目の入力画面GA2が表示された状態で、プロセッサ11は、ステップS2と同様、音声入力装置14で利用者の発話を収音する(S7)。このとき、利用者は、チェック1のエンジンの確認の点検項目に対し、例えば「OK」、「NG」等を発音する。
【0114】
プロセッサ11は、収音された音声の音声データをメモリ12に記憶する。プロセッサ11の音声認識部25は、メモリ12に記憶された音声データに対し音声認識を行い、音声を認識できたか否かを判別する(S8)。音声を認識できなかった場合、プロセッサ11は、ステップS7に戻り、再度、収音動作を行う。
【0115】
ステップS8で音声を認識できた場合、プロセッサ11は、音声認識されたテキストデータが該当する項目(チェック1の入力項目)に対する入力であるか否かを判別する(S9)。音声認識されたテキストデータがチェック1の入力項目に対する入力でない場合、プロセッサ11は、音声認識されたテキストデータが前の入力項目(社員IDの入力項目)に対する入力であるか否かを判別する(S10)。社員IDの入力項目に対する入力でない場合、プロセッサ11は、ステップS7の処理に戻る。なお、社員IDの入力項目に対する入力でない場合、プロセッサ11は、何も表示しなくてよいし、再入力を促すように、表示装置15に表示してもよい。
【0116】
ステップS10で音声認識されたテキストデータが社員IDの入力項目に対する入力である場合、つまり6桁の数字である場合、プロセッサ11は、この入力が社員IDの訂正であると判断し、訂正された社員IDを反映するように、チェック1の点検項目の入力画面GA12を更新する(S11A)。この後、プロセッサ11は、ステップS7の処理に戻る。
【0117】
ステップS9で音声認識されたテキストデータがチェック1の点検項目に対する入力である場合、プロセッサ11は、チェック2の点検項目の入力画面GA13を生成する(S9A)。プロセッサ11は、チェック2の点検項目の入力画面GA13を表示装置15に表示する(S12A)。チェック2の点検項目の入力画面GA13には、チェック1の点検項目の入力画面GA12で入力された確認結果(例えば「OK」)が表示される(
図10参照)。
【0118】
ステップS7~S12Aまでの同様の処理は、点検項目の数に相当するN回分繰り返される。つまり、点検項目の入力画面を第m番目の画面(m=2~N)で表すと、ステップS7~S12Aまでの同様の処理は、m=2~Nで行われる。
【0119】
その後、プロセッサ11は、表示装置15にチェックNの点検項目の入力画面GA2を表示する(S13A)。チェックNの点検項目の入力画面GANには、チェックN-1の点検項目の入力画面で入力された確認結果(例えば「OK」)が表示される。
【0120】
プロセッサ11は、この表示状態で、ステップS7と同様、音声入力装置14で利用者の発話を収音する(S14)。プロセッサ11は、収音された音声の音声データをメモリ12に記憶する。プロセッサ11の音声認識部25は、メモリ12に記憶された音声データに対し音声認識を行い、音声認識できたか否かを判別する(S15)。音声認識できなかった場合、プロセッサ11は、ステップS14に戻り、再度、利用者の発話を取得する。
【0121】
プロセッサ11は、音声認識されたテキストデータが該当する項目(チェックNの入力項目)に対する入力(例えば「OK」)であるかを判別する(S16)。音声認識されたテキストデータがチェックNの入力項目に対する入力でない場合、例えば、利用者が「前の項目 NG」と発話した場合、プロセッサ11は、音声認識されたテキストデータが前の入力項目(チェックN-1の入力項目)に対する入力であるか否かを判別する(S17)。
【0122】
音声認識されたテキストデータがチェックN-1の入力項目に対する入力である場合、プロセッサ11は、訂正されたチェックN-1のテキストデータを反映するように、チェックNの点検項目の入力画面を更新する(S18A)。この後、プロセッサ11は、ステップS14の処理に戻る。なお、ステップS17で音声認識されたテキストデータがチェックN-1の入力項目に対する入力でない場合、プロセッサ11は、ステップS14の処理に戻る。このとき、プロセッサ11は、何も表示しなくてよいし、再入力を促すように、表示装置15に表示してもよい。
【0123】
ステップS16で音声認識されたテキストデータがチェックNの点検項目に対する入力である場合、プロセッサ11は、点検結果画面GA3(
図7参照)を生成する(S19)。プロセッサ11は、表示装置15に点検結果画面GA3を表示する(S20)。この後、プロセッサ11は音声認識の動作を終了する。
【0124】
このように、実施の形態2の変形例1における操作端末10は、利用者が発話すると、自機で音声認識を行い、音声認識結果を表示する。ネットワーク環境が無い場所で操作端末を使用できる。ネットワーク環境を使用しないこと、また、音声処理装置を必要としないことで、低コスト化を図ることができる。また、点検項目が変わる度に、表示装置に表示される点検項目の入力画面が変化するので、利用者が視覚的に分かり易い入力操作を行うことができる。また、利用者は、点検項目が多い場合でも、次に点検する内容を即座に把握できる。
【0125】
(実施の形態1,2の変形例2)
実施の形態1、2では、音声処理装置50は、操作端末10から送信された音声データを基に音声認識を行い、この音声認識の結果を基に画面データを生成し、操作端末10に送信した。操作端末10は、音声処理装置50から送信された画面データを受信し、表示装置15に各種の画面を表示した。
【0126】
実施の形態1,2の変形例2では、操作端末10は、音声データを音声処理装置50に送信し、音声処理装置50から音声認識されたテキストデータを受信する。操作端末10は、受信したテキストデータを基に、自機で各種画面(社員IDの入力画面GA1、各点検項目の入力画面GA2、および点検結果画面GA3)の画面データを生成し、表示装置15に表示する。
【0127】
これにより、操作端末が音声認識を行う処理を省くことができ、かつ、音声処理装置が画面データを生成する処理を省くことができる。また、データ量の多い画面データをネットワークを介して通信しなくて済み、通信量が減ることでネットワーク通信のトラフィックを低減できる。
【0128】
以上、図面を参照しながら各種の実施の形態について説明したが、本開示はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても当然に本開示の技術的範囲に属するものと了解される。また、発明の趣旨を逸脱しない範囲において、上述した各種の実施の形態における各構成要素を任意に組み合わせてもよい。
【0129】
例えば、前述した実施の形態2では、1つの点検項目と1つの画面とが1対1に対応していた。つまり、1つの画面には、1つの点検項目の内容および入力が表示された。2以上の点検項目と1つの画面とを対応付け、1つの画面に2以上の点検項目の内容および入力が表示されてもよい。これにより、音声処理装置および操作端末が画面を生成する処理を軽減できる。
【0130】
また、前述した各実施の形態では、車両を点検する際、作業者による点検項目の表示を例示したが、車両の点検に限らず、工場で作業者が物を生産する工程の表示や、電柱等の高所で作業者が作業する工程の表示についても、本開示は同様に適用可能である。また、利用者が発話することで動作する、スマートスピーカやこれに連動する機器が表示機能を有する場合、ユーザが操作順に発話した音声認識結果を表示する際にも、本開示は同様に適用可能である。
【産業上の利用可能性】
【0131】
本開示は、ユーザが手を用いた操作を行うことが難しい状況等でも、ユーザ操作の入力時の利便性を向上する操作入力方法、操作入力システムおよび操作端末として有用である。
【符号の説明】
【0132】
5 操作入力システム
10 操作端末
11 プロセッサ
12、52 メモリ
13、53 通信回路
14 音声入力装置
15 表示装置
25 音声認識部
50 音声処理装置
51 プロセッサ
54 ストレージ
61 制御部
62 音声認識部
63 キーワードマッチング部
541 キーワードデータベース