(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024178804
(43)【公開日】2024-12-25
(54)【発明の名称】情報処理プログラム、情報処理装置及び情報処理方法
(51)【国際特許分類】
G06F 3/16 20060101AFI20241218BHJP
G10L 15/22 20060101ALI20241218BHJP
G10L 13/00 20060101ALI20241218BHJP
【FI】
G06F3/16 650
G06F3/16 610
G06F3/16 690
G10L15/22 200H
G10L13/00 100L
【審査請求】未請求
【請求項の数】25
【出願形態】OL
(21)【出願番号】P 2023097228
(22)【出願日】2023-06-13
(71)【出願人】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】渡辺 奈夕子
(72)【発明者】
【氏名】岩田 憲治
(72)【発明者】
【氏名】桑村 音晴
(57)【要約】
【課題】音声認識の専門家が不在の場合でも、適切な入力形式を定めることが可能な情報処理プログラム、情報処理装置及び情報処理方法を提供することである。
【解決手段】実施形態に係る情報処理プログラムは、情報取得部と、形式推定部と、をコンピュータに実現させる。前記情報取得部は、項目ごとに、音声入力の入力欄を含む記録用データシートから、1つ以上の項目と、前記1つ以上の項目に対する入力欄の値に関する情報とを取得する。前記形式推定部は、前記情報に基づいて、前記入力欄の入力形式を推定する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
項目ごとに、音声入力の入力欄を含む記録用データシートから、1つ以上の項目と、前記1つ以上の項目に対する入力欄の値に関する情報とを取得する情報取得部と、
前記情報に基づいて、前記入力欄の入力形式を推定する形式推定部と、
をコンピュータに実現させる情報処理プログラム。
【請求項2】
前記記録用データシートに含まれる複数の入力欄に値を入力するための入力手順が前記コンピュータのメモリに保持されており、
前記入力手順は、前記記録用データシートに含まれる入力対象項目の入力欄を識別する識別子と、前記推定された入力形式とを含んでいる、
請求項1に記載の情報処理プログラム。
【請求項3】
前記記録用データシートから複数の入力欄の範囲を選択する範囲選択部、を前記コンピュータに更に実現させ、
前記情報取得部は、前記選択された範囲の入力欄に対応して前記情報を取得し、
前記形式推定部は、前記対応して取得された前記情報に基づいて、前記範囲の入力欄に共通する入力形式を推定する、
請求項2に記載の情報処理プログラム。
【請求項4】
前記入力手順は、前記入力対象項目の項目名を含むガイダンスを更に含んでおり、
前記範囲選択部は、前記ガイダンス又は前記識別子に基づいて、前記入力欄の範囲を選択する、
請求項3に記載の情報処理プログラム。
【請求項5】
前記推定された入力形式に基づいて音声認識辞書を生成する辞書生成部と、
ユーザの発話に対して前記音声認識辞書を用いて音声認識を実行し、得られた音声認識結果のテキストを前記識別子に応じて前記入力欄に入力する認識制御部と、
を前記コンピュータに更に実現させる、請求項2に記載の情報処理プログラム。
【請求項6】
前記情報は、前記入力欄の値の例である入力値例であり、
前記情報取得部は、前記入力欄の値が予め入力された前記記録用データシートと、前記入力欄への値の入力を受け付けるユーザインタフェースとのうちの少なくとも一方から当該値を前記入力値例として取得する、
請求項1に記載の情報処理プログラム。
【請求項7】
前記情報は、前記入力欄の値の表示に用いられる書式設定であり、
前記情報取得部は、前記記録用データシートに含まれる前記書式設定を前記情報として取得する、
請求項1に記載の情報処理プログラム。
【請求項8】
前記情報は、前記入力欄の値の例である入力値例と、前記入力欄の値の表示に用いられる書式設定とを含んでおり、
前記情報取得部は、前記入力値例と前記書式設定とを含む前記情報を前記記録用データシートから取得する、
請求項1に記載の情報処理プログラム。
【請求項9】
前記形式推定部は、前記範囲の入力欄ごとに入力形式を推定し、前記推定された入力形式のうちの1つの入力形式を前記共通する入力形式として推定する、
請求項3に記載の情報処理プログラム。
【請求項10】
前記形式推定部は、前記範囲の入力欄ごとに入力形式を推定し、前記推定された入力形式のうちの複数を包含した入力形式を前記共通する入力形式として推定する、
請求項3に記載の情報処理プログラム。
【請求項11】
前記形式推定部は、前記対応して取得された前記情報の数に基づいて、前記推定した入力形式を調整する、
請求項3に記載の情報処理プログラム。
【請求項12】
前記入力手順は、前記入力欄の値の範囲を示す上下限値を更に含んでおり、
前記形式推定部は、前記入力手順に含まれる上下限値に基づいて、前記推定した入力形式を調整する、
請求項3に記載の情報処理プログラム。
【請求項13】
形式チェック部、を前記コンピュータに更に実現させ、
前記入力手順は、前記入力欄への音声入力に関するガイダンスを更に含んでおり、
前記形式チェック部は、前記推定された入力形式を、前記ガイダンスに基づいてチェックする、
請求項2に記載の情報処理プログラム。
【請求項14】
前記推定された入力形式から入力値例を生成し、前記生成した入力値例を音声合成し、前記音声合成して得た音声データに対して前記音声認識辞書を用いて音声認識を実行し、得られた音声認識結果のテキストと前記生成した入力値例とが合致するか否かを判定することで、前記推定された入力形式をチェックする形式チェック部、
を前記コンピュータに更に実現させる、請求項5に記載の情報処理プログラム。
【請求項15】
前記形式チェック部は、前記判定した結果、前記音声認識結果のテキストからコマンドが検出されたか否かを判定することで、前記合致しない場合の状況を分類する、
請求項14に記載の情報処理プログラム。
【請求項16】
前記形式チェック部は、前記判定した回数と前記判定した結果とに基づき、前記音声認識の認識率又は誤認識率を算出することで、前記入力形式をチェックする、
請求項14に記載の情報処理プログラム。
【請求項17】
前記形式チェック部は、前記入力形式をチェックした結果を識別可能に通知する、
請求項14に記載の情報処理プログラム。
【請求項18】
前記形式チェック部は、前記コマンドが検出された場合に、ユーザの操作に応じて、前記コマンドに一致する、音声入力のコマンドを変更する、
請求項15に記載の情報処理プログラム。
【請求項19】
前記記録用データシートを表示し、且つ前記記録用データシートに含まれる入力欄に、前記推定された入力形式を表示する表示部、
を前記コンピュータに更に実現させる、請求項1に記載の情報処理プログラム。
【請求項20】
前記推定された入力形式から1つ以上の入力値例を生成し、前記生成した入力値例を前記記録用データシートに含まれる入力欄に表示する表示部、
を前記コンピュータに更に実現させる、請求項1に記載の情報処理プログラム。
【請求項21】
前記推定された入力形式から前記入力欄に入力できる値の範囲を生成し、前記生成した範囲を前記記録用データシートに含まれる入力欄に表示する表示部、
を前記コンピュータに更に実現させる、請求項1に記載の情報処理プログラム。
【請求項22】
表示部を前記コンピュータに更に実現させ、
前記記録用データシートに含まれる入力対象項目の入力欄を識別する識別子と、前記推定された入力形式と、前記記録用データシートに含まれる複数の入力欄に値を入力する順序とを含む入力手順が前記コンピュータのメモリに保持されており、
前記表示部は、前記記録用データシートを表示し、且つ前記入力手順に基づいて、前記記録用データシートに含まれる複数の入力欄に、前記値を入力する順序を重畳表示する、
請求項1に記載の情報処理プログラム。
【請求項23】
前記推定された入力形式から入力値例を生成し、前記生成した入力値例を音声合成し、前記音声合成して得た音声データを、前記ユーザの発話に代えて前記認識制御部に提供することで、前記認識制御部による音声入力の動作例を表示する動作例表示部、
を前記コンピュータに更に実現させる、請求項5に記載の情報処理プログラム。
【請求項24】
項目ごとに、音声入力の入力欄を含む記録用データシートから、1つ以上の項目と、前記1つ以上の項目に対する入力欄の値に関する情報とを取得する情報取得部と、
前記情報に基づいて、前記入力欄の入力形式を推定する形式推定部と、
を備える情報処理装置。
【請求項25】
項目ごとに、音声入力の入力欄を含む記録用データシートから、1つ以上の項目と、前記1つ以上の項目に対する入力欄の値に関する情報とを取得することと、
前記情報に基づいて、前記入力欄の入力形式を推定することと、
を備える情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理プログラム、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
製造現場や保守点検現場においては、測定機器による測定値および目視による点検結果などを、帳票や表などの記録用データシートに入力し、入力後の記録用データシートを作業員同士または顧客との間で共有する場合がある。この場合、記録用データシートに入力するべき内容が予め定められており、作業者は作業手順通りに作業を行い、得られたデータを記録用データシート内の所定の位置に入力する。
【0003】
一般的な帳票ソフトではデータをテキストで入力するが、作業中にテキストを入力するのは時間がかかってしまうため、音声を使ってデータを入力したいというニーズがある。例えば、帳票ソフトとは別のアプリケーションで入力対象項目とその項目に入力する内容を設定することで、発話をした際に選択している項目に値を入力でき、さらには、設定時に次に入力する項目を指定しておくことで、連続して項目に値を入力できる音声入力手法がある。このような音声入力手法によれば、入力される値の入力形式を音声認識の専門家が予め定めておくことで、入力形式に基づいて音声入力を行うことが可能である。
【0004】
以上のような音声入力手法は、通常は特に問題ないが、本発明者の検討によれば、音声認識の専門家が不在の場合には、適切な入力形式を定めることが困難な点で改善の余地がある。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明が解決しようとする課題は、音声認識の専門家が不在の場合でも、適切な入力形式を定めることが可能な情報処理プログラム、情報処理装置及び情報処理方法を提供することである。
【課題を解決するための手段】
【0007】
実施形態に係る情報処理プログラムは、情報取得部と、形式推定部と、をコンピュータに実現させる。前記情報取得部は、項目ごとに、音声入力の入力欄を含む記録用データシートから、1つ以上の項目と、前記1つ以上の項目に対する入力欄の値に関する情報とを取得する。前記形式推定部は、前記情報に基づいて、前記入力欄の入力形式を推定する。
【図面の簡単な説明】
【0008】
【
図1】第1の実施形態に係る情報処理装置の構成を示すブロック図。
【
図2】第1の実施形態に係る帳票データの一例を示す図。
【
図3】第1の実施形態に係る入力手順記憶部の初期設定の一例を示す図。
【
図4】第1の実施形態に係る単語リストの一例を示す図。
【
図5】第1の実施形態に係る入力済み帳票の一例を示す図。
【
図6】第1の実施形態に係る入力手順記憶部の自動設定済みを示す図。
【
図7】第1の実施形態に係るガイダンスの入力形式対応表の一例を示す図。
【
図8】第1の実施形態に係る入力手順作成処理を示すフローチャート。
【
図9】第1の実施形態に係る範囲選択の一例を示す図。
【
図10】第1の実施形態に係るアラートの一例を示す図。
【
図11】第1の実施形態に係るアラートの他の一例を示す図。
【
図12】第1の実施形態に係る帳票の入力形式表示の一例を示す図。
【
図13】第1の実施形態に係る帳票の入力値例表示の一例を示す図。
【
図14】第1の実施形態に係る帳票の入力順序表示の一例を示す図。
【
図15】第1の実施形態に係る帳票の入力順序表示の他の一例を示す図。
【
図16】第1の実施形態に係る形式推定処理(連結無し)を示す図。
【
図17】第1の実施形態に係る形式振り分けルールの一例を示す図。
【
図18】第1の実施形態に係る形式推定(連結無し)を示す図。
【
図19】第1の実施形態に係る形式チェック処理を示す図。
【
図20】第1の実施形態に係る音声入力処理を示す図。
【
図21】第2の実施形態に係る情報処理装置の構成を示すブロック図。
【
図22】第2の実施形態に係る範囲自動選択の一例を示す図。
【
図23】第2の実施形態に係る入力手順作成処理を示すフローチャート。
【
図24】第3の実施形態に係る情報処理装置の構成を示すブロック図。
【
図25】第3の実施形態に係る入力手順作成処理を示すフローチャート。
【
図26】第3の実施形態に係る形式推定処理(連結無し)を示すフローチャート。
【
図27】第3の実施形態に係る形式チェック処理を示すフローチャート。
【
図28】第4の実施形態に係る情報処理装置の構成を示すブロック図。
【
図29】第4の実施形態に係る動作例表示処理を示すフローチャート。
【
図30】第5の実施形態に係る情報処理装置のハードウェア構成例を示す図。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら各実施形態を詳細に説明する。以下の説明では、音声入力機能を持つタブレット端末などの情報処理装置において、入力手順作成処理と、音声入力処理とを実行する場合を例に挙げて述べる。なお、情報処理装置としては、タブレット端末に限らず、外付けマイクや外付けスピーカーを装着したPC(Personal computer)やスマートフォン等の如き、任意のコンピュータが、適宜、使用可能となっている。また、情報処理装置は、必ずしも入力手順作成処理及び音声入力処理を行う必要はなく、少なくとも入力手順作成処理を行う装置であればよい。すなわち、入力手順作成処理のプログラムと、音声入力処理のプログラムとは、一つの情報処理プログラムとしてインストールしてもよく、別々の情報処理プログラムとしてインストールしてもよい。いずれにしても、情報処理装置は、当該情報処理プログラムを実行することにより、入力手順作成処理や音声入力処理の各機能を実現する。また、情報処理装置は、入力手順作成処理及び音声入力処理のうち、入力手順作成処理のみを行う場合には、マイクを省略してもよい。また、以下の説明中、入力手順作成処理に関するユーザを入力手順作成者と呼び、音声入力処理に関するユーザを音声入力者と呼ぶ。音声入力者と入力手順作成者とは、同一人物でもよく、異なる人物でもよい。また、複数の音声入力者と、複数の入力手順作成者とが協業してもよい。
【0010】
<第1の実施形態>
図1は、第1の実施形態に係る情報処理装置の構成の一例を示すブロック図である。この情報処理装置1は、データ記憶部2、入力手順記憶部3、入力値例取得部4、範囲選択部5、形式推定部6、形式チェック部7、辞書生成部8、音声認識部9、音声合成部10、認識制御部11及び表示部12を備えている。情報処理装置1は、メモリにインストールされた情報処理プログラムの実行により、各部の機能を実現するコンピュータである。
【0011】
ここで、データ記憶部2は、
図2に示すように、帳票や表などの、項目ごとに、音声入力の入力欄のあるデータを表す帳票データ2aを記憶する。帳票データ2aは、項目ごとに、音声入力の入力欄を含む記録用データシートの一例である。例えば、帳票データ2aは、行番号1~5の各々で示す行と、列番号B~Dの各々の項目とに関連付けた入力欄に値が入力され、行番号8~9の各々で示す行と、列番号B~Dの各々の項目とに関連付けた入力欄に値が入力される。なお、帳票データ2aは、後述する単語シートを別シートに備えてもよい。データ記憶部2は、コンピュータのメモリの一例である。
【0012】
入力手順記憶部3は、
図3に示すように、記録用データシートである帳票データ2aに含まれる複数の入力欄に値を入力するための入力手順3aを記憶する。入力手順3aは、例えば、手順番号、入力対象項目、入力形式、ガイダンス及び基準値を項目名として含んでいる。但し、手順番号、ガイダンス及び基準値は、任意の付加的事項であり、省略してもよい。このような入力手順3aは、複数の項目に入力を行うための順序のリストとしても機能する。入力手順3aの順序はリストの上から下に決まっているものとしても良いし、別途、順序を表す番号を入力手順の項目として持っていても良い。入力手順記憶部3は、コンピュータのメモリの一例である。
【0013】
ここで、手順番号の項目名は、手順番号の値として、帳票データ2aに含まれる複数の入力欄に値を入力する順序を示す番号を表している。
【0014】
入力対象項目の項目名は、入力対象項目の値として、帳票データ2aに含まれる入力対象項目の入力欄を識別する識別子を表している。識別子は、例えば帳票データが
図2のように表形式であれば、列番号と行番号を用いてD2のように記述してもよい。
図3中、入力手順3aは、1回目の測定結果入力としてB1、B2、…、B5に入力した後、B8、C8、D8と入力を行い、2回目の測定結果入力としてC1、C2、…、C5と入力を続けていく例を示している。
【0015】
入力形式の項目名は、入力形式の値として、形式推定部6により推定された入力形式を表している。なお、入力手順3aは、推定された入力形式を入力可能な入力形式欄を含んでおり、形式推定部6により推定された入力形式が当該入力形式欄に入力される。補足すると、入力形式は、入力対象項目の入力欄に入力するべき値の形式を指定する。後述する認識制御部11では、入力形式欄に入力された入力形式を元に音声認識辞書を作成する。音声認識辞書を直接入力手順に記載するのは難易度が高いため、本実施形態では記述を簡素化した入力形式を入力する。
【0016】
入力形式の大分類としては、例えば『数値』『英数字』『日時』『日付』『時刻』『単語』などが、適宜、使用可能となっている。
【0017】
『数値』の場合、更に、何進数か(十進数、十六進数など)、十進数の場合整数部の桁数が何桁か(範囲指定できても良い)、小数部の桁数が何桁か、等を指定できて良い。
【0018】
例えば、十進数、整数部の桁数範囲Mmin~Mmax、小数部の桁数範囲Nmin~Mminとすると、入力形式は、『十進数_Mmin~Mmax_Nmin~Nmax』と記載される。また、入力形式は、「数値」の桁数に上限が無い場合には『十進数_Mmin~_Nmin~』のように記載され、「数値」の下限が無い場合には『十進数_~Mmax_~Nmax』のように記載される。また、入力形式は、「数値」の桁数の範囲が無い場合(整数部の桁数M、小数部のN)に『十進数_M_N』のように記載される。また、入力形式は、「数値」において、数字の前に正負の符号「+(プラス)」や「-(マイナス)」を発話する場合、『[+-]十進数_M_N』のように記載される。
【0019】
『英数字』の場合、更に、英字、数字、記号のパターンを指定できて良い。例えば、英数字のパターンとして、英字であれば『A』、数字であれば『D』、記号であれば『S』と記載してもよい。また、「英数字」としては、英字または数字であれば『$』、英字または数字または記号であれば『!』の文字を用い、例えば英字3文字、数字2字、記号1字、英字1文字のパターンであれば『英数字_AAADDSA』と記載してもよい。
【0020】
また、「英数字」において、オプショナルな文字(入力してもしなくても良い文字)には『?』を付けるものとする。例えばパターン『英数字_AAA?DD』は、英数字2文字または3文字、数字2字のパターンを表す。このほかにも1文字のパターンだけでなく、複数文字入力できるパターンを記述できても良い。
【0021】
『日時』『日付』『時刻』の場合、特に追加の指定は不要とするが、『日付』については『年月日』『月日』『年月』『日』など日付のうち、どの内容を入力するかを指定する等追加の指定を記述できるようにしても良い。
【0022】
『単語』の場合、
図4に一例を示すように、帳票データ2aの別シートに単語リスト2bを記述し、その単語リスト2bのグループ名を指定するものとする。単語リスト2bは、グループ名の他、単語の表記、対応する読み(ユーザが発話する読み)、読み上げ(ガイダンス等で復唱を行う際に読み上げる内容)を含んでいる。本実施形態では単語リスト2bを自動で生成するため、グループ名に自動で番号を付与する。入力値例からは単語の表記のみ取得できるので、表記から読み、読み上げの内容を生成する。読み、読み上げの項目は、入力手順作成者が後で別の内容に変更できるように別の項目として用意しているが、生成する段階では同じ内容を生成して設定すればよい。読み、読み上げの生成は既存のどのような手法を使っても良い。例えば形態素解析技術と形態素解析用の辞書を用いれば良い。
【0023】
なお、入力形式は、上記した大分類に限らず、音声認識辞書に変換できる入力形式であればよく、個々の入力形式の組み合わせを用いてもよい。例えば、入力形式としては、『日付_月日、単語_曜日、(時刻_時分)』という連結した形式を用いても良い。この場合、日付の発話後、単語グループ「曜日」(日曜日、月曜日、火曜日、…)を発話し、その後時刻を発話するか、もしくは発話しないことができる。連結の中の()は発話がオプショナルであることを表す。この場合、認識される結果はスペース区切りになるものとする。例えば『日付_月日、単語_曜日、(時刻_時分)』であれば「3/10(スペース)金曜日(スペース)9:10」や「3/11(スペース)土曜日」などが認識結果として得られる。
【0024】
また、入力形式は、例えば『時刻_時分|時刻_時分秒』や『十進数_2_1|単語_異常ありなし』のように、複数の入力形式のORを入力形式として用いても良い。この場合、『時刻_時分』と『時刻_時分秒』のどちらを発話しても良く、また『十進数_2_1』と『単語_異常ありなし』のどちらを発話しても良い。例えば『時刻_時分|時刻_時分秒』であれば「9:10」「13:20:10」などが、『十進数_2_1|単語_異常ありなし』であれば「12.3」「異常あり」などが認識できる。
【0025】
また、入力形式は、以上の連結した形式やORを組み合わせたものを用いても良い。また入力形式の記述方法も、前述したものに限らず、音声認識辞書に変換できる記述方法であれば良い。なお、入力形式をできるだけ狭く(数値であれば桁数の範囲が狭く、単語であれば単語リストの数を少なく)指定する方が音声認識率は向上するが、入力できる発話内容が絞られることになるため細かすぎると音声入力者の使い勝手が低くなる。
【0026】
ガイダンスの項目名は、ガイダンスの値として、実際に入力手順を実行して音声入力を行う際に、該当手順での作業指示を提示するために各手順の開始時に再生する内容として用いられる。なお、ガイダンスは、入力対象項目の項目名に限らず、入力欄への音声入力に関するガイダンスであればよい。例えば、点検の入力手順の場合、ガイダンスは、点検手順の内容を指導(ガイダンス)する記述を含む。全てのガイダンスのうち、〇〇時刻のような特定のパターンに合致するガイダンスのみが、後段の入力形式チェック等で使用される。
【0027】
基準値の項目名は、基準値の値として、入力欄に入力される値について、基準となる値の範囲を表している。基準値としては、入力欄の値の範囲を示す値であって、上限値、下限値又は上下限値のいずれを含んでもよい。基準値は、実際に入力手順を実行して音声入力を行う際に、音声入力で入力された値が異常かどうかをチェックすることに用いられる。
【0028】
以上のような入力手順3aは、帳票データ2aとは別のデータとして入力手順記憶部3に保持する場合に限らず、帳票データ2a上に保持しても良い。例えば一般的な表計算アプリケーションでは、一つのファイル上に複数の表シートを作成できるので、このうち一つを帳票データ用、もう一つを入力手順保持用として用いるように実装してもよい。この場合、後述する認識制御部11では手順保持用のシートから入力手順を取得する。また、入力手順3aは、帳票データ2aとは別に保持される場合、DB(Database)等のストレージに保持してもよく、メモリ上に保持してもよい。本実施形態では、帳票データ2aのファイルの別シートに、入力手順保持用のシートがあるものとする。この場合、入力手順保持用のシートを別の帳票データのファイルにコピーすることで、コピー先の帳票データでも音声入力をすることができる。
【0029】
なお、入力手順3aは、入力形式以外の領域を、手入力で作成しても良い。例えば、帳票データ2aのファイルに手順保持用のシートを作成する場合、
図3と同様のテーブルを手順保持用のシートに手入力することで、入力形式以外の入力手順3aを作成してもよい。また、入力手順3aは、入力対象項目をクリックしてダイアログを表示し、ダイアログ上で入力形式以外の情報を手入力して作成しても良い。
【0030】
入力値例取得部4は、項目ごとに、音声入力の入力欄を含む帳票データ2aから、1つ以上の項目と、1つ以上の項目に対する入力欄の値に関する情報とを取得する。入力欄の値に関する情報としては、例えば、入力欄の値の例である入力値例、入力欄の値の表示に用いられる書式設定、が適宜、使用可能となっている。第1の実施形態では、入力欄の値に関する情報として、入力値例を用いている。この場合、入力値例取得部4は、入力欄の値が予め入力された帳票データ2aと、入力欄への値の入力を受け付けるユーザインタフェースとのうちの少なくとも一方から当該値を入力値例として取得することが可能である。入力欄の値が予め入力された帳票データ2aとしては、帳票データ2aの全ての入力欄のうちの少なくとも1つの入力欄が入力済みであれば、当該入力済みの入力欄から入力値例が取得可能となっている。また、入力値例取得部4は、範囲選択部5により選択された範囲の入力欄に対応して、入力欄の値に関する情報を取得してもよい。なお、「入力欄の値に関する情報」は、「入力欄への入力ヒント」、「入力欄への入力ヒント情報」等と適宜、読み替えてもよい。入力値例取得部4は、情報取得部の一例である。
【0031】
図5に入力済みの帳票データ2aの例を示す。この帳票データ2aの場合、1回目と2回目の測定結果値、騒音計測については#1の位置1、位置2のみが入力されている。入力値例取得部4は、入力済みの帳票データ2aに対して、各入力手順の入力対象項目の識別子が指す項目の値を取得することで、入力値例を取得する。例えば
図5の帳票データ2aに対し、
図3の手順番号1の入力手順の入力値例は、識別子B1の入力対象項目の値を取得すればよいので、「10:30」となる。このような入力済みの帳票データ2aは、音声入力手順の設定以前に手入力で入力したものを用いても良いし、設定のために新たに入力値例を手入力しても良い。また入力済みの帳票データ2aは、1つでなく複数あっても良い。複数の帳票データ2aがある場合、1つの入力手順に対して入力値例が複数得られることになる。また、仮にダイアログ等のユーザインタフェースから手順を設定する場合には、ダイアログに入力値例の入力を受け付けるためのテキストボックスを追加し、入力値例取得部4は、テキストボックスに入力されたテキストを取得することで入力値例を取得しても良い。
【0032】
範囲選択部5は、帳票データ2aから複数の入力欄の範囲を選択する。補足すると、範囲選択部5は、入力形式を推定する範囲として、複数の入力欄の範囲を選択する。例えば、範囲選択部5は、入力形式を設定する範囲を選択するためのユーザインタフェースを提供する。範囲選択部5は、帳票を表示する既存のアプリケーションの機能を用いて良いし、その他の方法を用いても良い。
【0033】
形式推定部6は、入力値例取得部4に取得された入力値例に基づいて、入力欄の入力形式を推定する。また、形式推定部6は、範囲選択部5に選択された範囲の入力欄に対応して取得された入力値例に基づいて、当該範囲の入力欄に共通する入力形式を推定してもよい。なお、共通する入力形式は、複数の入力値例から推定される。また、形式推定部6は、範囲の入力欄ごとに入力形式を推定し、推定された入力形式のうちの1つの入力形式を当該共通する入力形式として推定してもよい。また、形式推定部6は、範囲の入力欄ごとに入力形式を推定し、推定された入力形式のうちの複数を包含した入力形式を当該共通する入力形式として推定してもよい。また、形式推定部6は、選択された範囲の入力欄に対応して取得された入力値例の数に基づいて、推定した入力形式を調整してもよい。また、形式推定部6は、入力手順3aに含まれる基準値(例、上下限値)に基づいて、推定した入力形式を調整してもよい。いずれにしても、形式推定部6は、入力値例から入力形式を推定し、推定した入力形式で入力手順3aの入力形式欄を更新する。
図6に更新された入力手順3aの例を示す。この場合、B4、C4、D4以外の項目への入力手順3aについては入力形式が設定済みになっている。
【0034】
形式チェック部7は、推定された入力形式の妥当性についてチェックする。例えば、形式チェック部7は、推定された入力形式を、入力手順3aに含まれるガイダンスに基づいてチェックする。
【0035】
また例えば、形式チェック部7は、推定された入力形式から入力値例を生成し、生成した入力値例を音声合成し、音声合成して得た音声データ(音声波形データ)に対して音声認識辞書を用いて音声認識を実行する。音声認識結果のテキストは、入力値例、コマンド、又はそれ以外を表す。また、形式チェック部7は、得られた音声認識結果のテキストと当該生成した入力値例とが合致するか否かを判定することで、推定された入力形式をチェックしてもよい。なお、形式チェック部7は、判定した結果、音声認識結果のテキストからコマンドが検出されたか否かを判定することで、入力値例に合致しない場合の状況を分類してもよい。但し、コマンドの検出に関する判定は、入力値例との合致に関する判定結果が否の場合に限らず、実行される。また、形式チェック部7は、判定した回数と判定した結果とに基づき、音声認識の認識率又は誤認識率を算出することで、入力形式をチェックしてもよい。また、形式チェック部7は、入力形式をチェックした結果を識別可能に通知してもよい。入力形式をチェックした結果としては、例えば、入力値例との合致に関する判定結果、コマンドの誤検出に関する判定結果、それ以外の誤認識に関する判定結果、誤認識率などの統計情報、が適宜、使用可能となっている。また、形式チェック部7は、コマンドが検出された場合に、ユーザの操作に応じて、当該コマンドに一致する、音声入力のコマンドを削除又は変更してもよい。すなわち、形式チェック部7は、音声入力のコマンドとのバッティングが起こった場合に、音声入力のコマンドを削除、もしくは音声入力のコマンドの文言を変更することで解決してもよい。
【0036】
いずれにしても、形式チェック部7は、ガイダンスに基づくチェックと、音声合成を用いたチェックとの少なくとも一方を実行する。
【0037】
ここで、ガイダンスに基づく形式チェックの場合、入力手順3aにガイダンスが設定されていることを前提とする。形式チェック部7は、ガイダンスの文言と、推定された入力形式に齟齬が無いかをチェックする。例えば、ガイダンスの文言が「○○時刻」とあり、入力形式が時刻形式でない場合、齟齬があることが分かる。
【0038】
図7に、ガイダンスの文言の条件とそれに対応する入力形式のルール表の例を示す。ガイダンスの列にはガイダンスの条件として、ガイダンス文言の一部にマッチする正規表現が記載されている。入力形式の列には、ガイダンスが条件に合致した際に入力形式が満たすべき内容が記載されている。
【0039】
形式チェック部7は、選択された範囲に対応した入力手順毎に、設定されたガイダンスの文言がルール表のガイダンスに合致するかどうかをチェックする。合致するガイダンスの行があったら、その行の入力形式と推定された入力形式が合致するかどうかをチェックする。合致しない場合は入力手順作成者にその旨通知する。
【0040】
音声合成を用いた形式チェックの場合、形式チェック部7は、推定された入力形式から生成した入力値例の音声波形データを音声認識することにより、推定した入力形式について、音声認識し辛い入力値例が生成されるか否かをチェックする。
【0041】
補足すると、形式チェック部7は、1つの入力手順につき、音声合成を用いてそれぞれの入力値例のテキストを音声波形データに変換する。なお、形式チェック部7は、予め定めた数だけ入力値例を生成したときや、ユーザによる所定の操作を受け付けたとき、といった任意のタイミングで音声合成を実行可能である。また、形式チェック部7は、更に得られた音声波形データを、該当する入力形式に対して辞書生成部8で生成された音声認識辞書を用いて音声認識する。形式チェック部7は、この際、後述する認識制御部11で用いるコマンド認識のための音声認識も同時に動作させる。形式チェック部7は、コマンド認識のための音声認識が入力値用の音声認識とは別の音声認識の場合、2つの音声認識の双方を用いて生成された入力値例を認識する。コマンド認識のための音声認識として入力値用の音声認識を用いる場合、生成する音声認識辞書にコマンド認識のための辞書をも含めるようにし、当該コマンド認識のための辞書を用いて音声認識を行う。これにより、生成した入力値例の音声認識結果が得られる。また、形式チェック部7は、音声認識結果と生成した入力値例とを比較し、全て合致していれば、推定された入力形式が妥当である旨を判定する。
【0042】
辞書生成部8は、推定された入力形式に基づいて音声認識辞書を生成する。例えば、辞書生成部8は、入力手順3aの入力形式欄に設定された入力形式から、当該入力形式の音声発話を認識可能な音声認識辞書を生成する。ここで、音声認識辞書は、文法を記載したものであり、入力形式から一意に生成できるものとする。また、辞書生成部8は、コマンド認識のための辞書も並行して生成する。
【0043】
音声認識部9は、形式チェック部7及び認識制御部11に制御され、音声認識辞書を用いて音声波形データをテキストに変換する。例えば、音声認識部9は、音声入力のための発話を認識するために、予め定めた文法を記載した音声認識辞書を用いる音声認識を使うことを想定する。この種の音声認識では、文法に沿った発話の音声波形データを認識し、それ以外の発話の音声波形データをリジェクトする。音声認識辞書の形式は使用する音声認識技術に依存し、テキストで記載された文法でも良いし、バイナリの辞書でも良い。また、メモリ上に保持されたオブジェクトの形式でも良い。また、音声波形データは、ユーザの発話から得られてもよく、テキストの音声合成により得られてもよい。
【0044】
本実施形態では、項目への入力を音声で行うほか、入力を元に戻す、次の入力手順に進む、入力を終了するなどの項目入力とは別のコマンドを音声で発話し、コマンドを実行できるものとする。この際、形式チェック部7、認識制御部11では、コマンド認識のための音声認識も同時に行う。
【0045】
コマンド認識は、前述した音声認識と同じものを使っても良いし、別の音声認識を用いても良い。例えば文法を用いた音声認識では無く、キーワードリストに含まれるキーワードの発話を検出するような音声認識を用いても良い。音声認識はこれらに限ったものでは無く、一般的な話し言葉に対する音声認識を用いても良い。この場合、音声認識辞書は認識するべき単語の表記と読みから成る単語辞書、認識結果をリジェクトするか否かを判定するための文法辞書があれば良い。
【0046】
なお、コマンド認識のための音声認識が項目への入力用の音声認識と別の音声認識の場合、音声認識部9は、2つの音声認識の双方を用いて生成された入力値例を認識する。また、コマンド認識のための音声認識として項目への入力用の音声認識と同じ音声認識を用いる場合、音声認識部9は、音声認識辞書にコマンド認識のための辞書を含めるようにし、その辞書を用いて音声認識を行う。
【0047】
音声合成部10は、形式チェック部7及び認識制御部11に制御され、テキストを音声波形データに変換する。音声合成部10は、音声波形データをスピーカーに流すことで、テキストを音声としてスピーカーから再生することができる。音声合成部10は、形式チェック部7で推定された入力形式の妥当性をチェックする際、認識制御部11で個々の入力手順開始時のガイダンスを再生する際、および、入力された内容を復唱する際などに用いられる。
【0048】
認識制御部11は、ユーザの発話に対して音声認識辞書を用いて音声認識を実行し、得られた音声認識結果のテキストを、入力対象項目の入力欄を識別する識別子に応じて入力欄に入力する。例えば、認識制御部11は、入力手順に従ってユーザの音声発話を音声認識し、認識結果を帳票データ2aの入力欄に入力する。あるいは、認識制御部11は、入力手順の入力形式から生成された音声認識辞書を用いて音声認識を行い、入力手順の入力対象項目の入力欄に認識結果を入力してもよい。
【0049】
例えば、認識制御部11は、表示部12には帳票データを表示しておき、入力手順の順序に従って入力手順記憶部3から入力手順を一つ取り出す。認識制御部11は、入力手順に設定されているガイダンス内容を音声合成部10により音声合成する。認識制御部11は、入力手順に設定されている入力形式から生成された音声認識辞書(およびコマンド認識辞書)を用いて音声認識部9により音声認識する。コマンドが認識された場合、認識制御部11は、該当するコマンドの内容を実行する。コマンド以外が認識された場合、認識制御部11は、音声認識結果に対して音声合成を行い復唱後、入力手順に設定されている基準値と認識結果とを比較し、基準値内であれば認識結果を入力対象項目に入力する。認識制御部11は、基準値外であれば、その旨を音声合成で通知しつつ、再入力を促す、または強制的に入力する。
【0050】
表示部12は、情報処理装置1の処理に応じたデータを表示する。例えば、表示部12は、帳票データ2aを表示し、且つ帳票データ2aに含まれる入力欄に、推定された入力形式を表示する。また例えば、表示部12は、推定された入力形式から1つ以上の入力値例を生成し、生成した入力値例を帳票データ2aに含まれる入力欄に表示してもよい。また例えば、表示部12は、推定された入力形式から入力欄に入力できる値の範囲を生成し、生成した範囲を帳票データ2aに含まれる入力欄に表示してもよい。また例えば、表示部12は、帳票データ2aを表示し、且つ入力手順3aに基づいて、帳票データ2aに含まれる複数の入力欄に、値を入力する順序を重畳表示してもよい。
【0051】
具体的には例えば、表示部12は、ユーザの音声発話を録音するためのマイクと、音声を再生するためのスピーカと、記憶データや各種情報を表示するディスプレイと、ディスプレイに表示する内容を制御する制御回路とを備えている。表示部12は、ディスプレイ等に帳票データ2aを表示する。また、表示部12は、帳票データ2aに入力手順3a内のデータを、適宜、重畳表示してもよい。表示部12は、スピーカ及びディスプレイを含むことから出力部と呼んでもよく、マイクを更に含むことから入出力部と呼んでもよい。
【0052】
次に、以上のように構成された情報処理装置による入力手順作成処理の動作と音声入力処理の動作について
図8乃至
図20を用いて説明する。以下の説明では、入力手順作成者が、一部入力済みの帳票データ上で入力形式以外の入力手順リストを作成した後、情報処理装置1が、入力手順作成処理を実行して入力手順リストを完成させる。また、情報処理装置1は、完成した入力手順リストを未入力の帳票データにコピーすることで、未入力の帳票データに対する音声入力処理が実行可能となる。
【0053】
(入力手順作成処理:
図8)
ステップST1において、情報処理装置1は、入力手順作成者の操作に応じて、入力形式以外が設定済みの入力手順3aとしての入力手順リストを作成する。すなわち、ステップST1の入力手順3aは、入力形式が未設定である。
【0054】
ステップST2において、範囲選択部5は、入力手順3aのうち、入力形式が設定されていない手順が残っているか否かを判定し、否の場合には入力手順作成処理を終了する。一方、ステップST2の判定の結果、範囲選択部5は、未設定の入力形式が残っている場合にはステップST3に移行する。
【0055】
ステップST3において、範囲選択部5は、
図9に示すように、入力手順作成者によるカーソルcsの操作に応じて、帳票データ2a上で1つ以上の入力対象項目に対応する複数の入力欄を含む範囲5aを選択し、表示される入力形式推定ボタン5bを押下する。なお、範囲選択部5は、1つの入力欄のみを含む範囲を選択してもよい。
【0056】
ステップST4において、入力値例取得部4は、選択範囲内の入力欄の識別子を入力対象項目として持つ手順(O
1,O
2,…,O
n)を入力手順リストから取り出す。但し、nは、選択範囲内の手順Oの個数を表す。
図9の場合、取り出された手順(O
1,O
2,…,O
n)は、入力手順3aにおける入力対象項目が示す入力欄の識別子B1,C1,D1に対応する3つの行である(n=3)。
【0057】
ステップST5において、入力値例取得部4は、選択範囲内の項目の入力値例(E
1,E
2,…,E
m)を帳票データ2aから取得する。但し、mは、選択範囲内の入力値例の個数を表す。
図9の場合、取り出された入力値例(E
1,E
2,…,E
m)は、「10:30」「12:00」の2つである(m=2)。
【0058】
ステップST6において、形式推定部6は、取得した手順(O1,O2,…,On)と、その入力値例(E1,E2,…,Em)とに基づいて、入力形式を推定する形式推定処理を実行する。形式推定処理の結果によって入力手順3aの入力形式が更新(設定)される。ステップST6の形式推定処理の詳細は後述する。
【0059】
ステップST7において、形式チェック部7は、推定及び更新された入力形式に対して形式チェック処理を実行し、通知の要/不要、要通知の場合には、通知する誤認識リストを得る。ステップST7の形式チェック処理の詳細は後述する。
【0060】
ステップST8において、形式チェック部7は、形式チェック結果が要通知か否かを判定し、否の場合にはステップST11に進む。一方、ステップST8の判定の結果、要通知の場合にはステップST9に移行する。
【0061】
ステップST9において、形式チェック部7は、要通知の場合には誤認識リストを形式チェック結果として表示部12に通知する。表示部12は、形式チェック結果を表示する。
【0062】
ここで、形式チェック結果にアラートを含む表示例について
図10及び
図11を用いて説明する。
【0063】
入力値例の音声認識の結果、コマンドの誤検出が生じた場合、その入力値例を発話すると、誤ってコマンドが認識される状況となる。この場合、例えば、入力値例からコマンドを認識する認識結果が得られたか、もしくは、入力値例に対してコマンド認識辞書を同時に用いて認識し、コマンドが認識結果として得られた状況となる。いずれにしても、表示部12は、画面上に『コマンドが誤検出される可能性がある』旨を、誤検出が起きた入力対象項目、入力形式(単語の場合は単語リスト内の単語も含める)、入力値例と紐づけて表示する。これは特に『単語』などであれば入力する単語を変更することでコマンドの誤検出を防ぐことができる可能性があるため、有用である。
【0064】
図10は、コマンドの誤検出を表す形式チェック結果をダイアログ7aで通知する表示例を示す。この例では、「異常なし」「異常あり」といった単語がコマンド「以上」をバッティングしており、コマンドが誤検出されることを通知している。また、誤検出が起きた入力対象項目、推定された入力形式も併せて通知している。通知内容の表示方法はこれに限らず、例えば誤検出が起きた入力対象項目をハイライトする等しても良い。
【0065】
図10のダイアログ7aの下部には『入力形式の変更』『コマンドの変更』『そのまま』のボタンbt1~bt3が表示されており、ボタンbt1~bt3のいずれかを操作することでコマンド誤検出の可能性にどのように対処するかを選択することができる。
【0066】
表示部12は、入力手順作成者が『入力形式の変更』を示すボタンbt1を操作した場合には、手順保持用のシートの該当する入力手順の部分に表示を移動する、入力形式変更用のダイアログを表示する、などして入力形式の変更を促す。
【0067】
また、表示部12は、入力手順作成者が『コマンドの変更』を示すボタンbt2を操作した場合には、誤検出されたコマンドの文言を自動で変更する。例えば1つのコマンドにつき複数の候補を持っておき、誤検出が起きた場合はそれ以外の候補から選択したものに変更しても良いし、word2vecや類語辞典等を参照し、類似した意味の文言に変更しても良い。変更した場合、形式チェック部7は、再度形式チェックを実行し、変更後のコマンドで同様の問題が起きないかどうかをチェックする。表示部12は、入力手順作成者が『そのまま』を示すボタンbt3を選択した場合には、何もしない。
【0068】
一方、以上に述べたコマンドの誤検出が起こらずとも、誤認識が起こる可能性がある。例えば数字の「9」とアルファベットの「Q」は両方とも発話は「きゅう」であり、発話し分けることができない。そのほか、単語によっては認識が難しい場合もある。
【0069】
そこで、形式チェック部7は音声認識結果と生成した入力値例を比較し、音声認識率を算出しても良い。このような入力値例が必ずしも生成されるとは限らないため、入力値生成の際に必ず「9」「Q」のような問題が起きやすい例を含むように生成しても良い。音声認識率が予め定めた閾値よりも低い場合、コマンド誤検出の場合と同様、入力手順作成者にその旨を通知する。また認識率が低下した旨だけでなく、誤認識が起きた具体的な個所も音声認識結果と生成した入力値例の比較から得られるため、問題の詳細内容として同時に通知しても良い。
【0070】
図11は、認識率の低下を表す形式チェック結果をダイアログ7bで通知する表示例を示す。この例では『コマンドの変更』を示すボタンbt2ではなく、『範囲選択のし直し』を示すボタンbt4を表示する。認識率の低下の場合、選択範囲を変更することで入力形式が変わり、認識率の低下が抑えられる可能性があるため、ボタンbt4を表示している。このように形式チェック部7により、実際に音声入力手順作成者が発話をして動作を確認する手間を省くことができる。またアラート表示を行うことで、問題点を入力手順作成者に伝え、改善を促すことができる。
【0071】
このようなアラート表示は、全入力形式の推定を終えた後に形式チェックを一度に行う場合には、問題があった選択範囲をハイライトしつつ、その下に
図10及び
図11に示すようなダイアログ7a,7bを表示すれば良い。
【0072】
また、音声入力手順作成者が範囲選択、入力形式の推定を行うごとに形式チェックを実行しても良い。この場合、形式チェック後、問題があれば同様にアラートを表示すればよい。アラートの通知方法は、ダイアログ7a,7bの表示に限らず、ステータスバーに表示する、音声で通知する等のように、任意の方法が使用可能である。
【0073】
しかる後、ステップST10において、表示部12は、入力手順作成者の操作に応じて、形式チェック結果に対して対処を行う。なお、表示部12は、入力手順作成者の操作に応じて、形式チェック結果を放置してもよい。
【0074】
ステップST11において、表示部12は、入力手順作成者の操作に応じて、入力形式・入力値例の帳票データへの重畳表示を実行する。重畳表示中、入力手順作成者は、設定された入力形式に問題が無いか、入力形式未設定の入力手順が無いかを確認する。
【0075】
例えば、表示部12は、メニュー等を表示し、メニュー内の機能選択から選択するなどして重畳表示を実行すれば良い。
【0076】
図12は、帳票データ2aに入力手順中の入力形式を重畳した表示例を示す図である。表示部12は、帳票データ2aの上部にメニュー12aを表示している。入力対象項目は、例えば、色を付けて表示してもよい。
【0077】
入力形式は、入力手順記憶部3内の入力手順3aの内容をそのまま表示しても良いし、入力手順作成者に分かりやすく、一覧しやすいよう、入力手順3aの内容を変換して表示しても良い。例えば
図12の例では時刻や数値の入力形式はそのまま表示しているが、単語の入力形式についてはグループ名ではなく単語リストを“|”で連結したものを表示している。
【0078】
図13に、入力形式から入力値例を生成し、帳票データ2aに重畳表示する例を示す。入力値例を重畳表示することで、入力形式そのものを表示するよりも直感的にどのような値が入力できるようになっているかを確認することができる。どちらの場合でも、入力形式が未設定の入力手順の入力対象項目は、そのことがわかるように表示する。
図13の例では項目の色を変えるとともに、アイコンを表示している。
【0079】
また、入力形式や入力値例の他にも、ガイダンスや入力の順序などを重畳表示することで、入力手順全体が正しく設定されたかどうかを確認できるようにしても良い。入力の順序の表示としては、
図14及び
図15に示すように、順序の番号を表示してもよく、順序を矢印で表示してもよい。
【0080】
ステップST11の後、情報処理装置1は、ステップST2に戻り、入力形式が全て設定されるまで、ステップST2~ST11を繰り返し実行する。
【0081】
次に、ステップST6の形式推定処理の詳細について説明する。
【0082】
(ステップST6の形式推定処理の詳細)
形式推定処理は、入力形式に連結を許容するか、しないかによって処理が変わる。
【0083】
(連結を許容しない場合:
図16)
図16に連結が無い場合の形式推定処理のフローチャートを示す。
【0084】
ステップST601~ST603において、形式推定部6は、選択範囲内の入力値例(E1,E2,…,Em)の各々について、入力値例Eiに合致する入力形式の大分類Giを推定する(i≦m)。
【0085】
例えば入力値例E
iが「-12.34」のような数値と小数点、符号のみからなる場合、これは数値であるとわかる。
図17にこのような大分類振り分けのルールの例を示す。本ルールの例では、条件に正規表現を記載している。このような表の優先度が高い順に、入力値例E
iが条件の正規表現に合致する場合は該当する大分類G
iと見なすことができる。
【0086】
どれにも合致しなかった場合、入力値例Eiは、一番下の『単語』を表す大分類Giに振り分けられる。例えば入力値例Eiが「2023/03/07」の場合、条件の正規表現のうち「¥d¥d¥d¥d/¥d?¥d/¥d?¥d」に合致するため、『日付』であるとわかる。大分類振り分けの方法はこれに限らず、ルールもこの条件に限らない。また、このようなルールを持つのではなく同様の処理をプログラムとして書き下しても良い。
【0087】
ステップST604において、形式推定部6は、ORの入力形式が許容されない場合には、ステップST605に進む。ORの入力形式が許容されるか否かは、予め決められている。
【0088】
ステップST605において、形式推定部6は、入力形式の大分類(G1,G2,…,Gm)の中から1つの大分類Gを選択する。形式推定部6は、選択した大分類Gに合致した入力値例をデータ記憶部2等のメモリに記憶する。
【0089】
補足すると、選択された範囲に複数の入力値例(E1,E2,…,Em)がある場合には、複数の項目に対応する複数の入力値例がある場合と、1つの入力対象項目に対応する複数の入力値例がある場合とがある。いずれの場合にしても、それぞれの入力値例に合致した入力形式の大分類(G1,G2,…,Gm)を統合し、1つの大分類Gを選択する必要がある。
【0090】
入力形式の統合は全ての入力形式を包含させても良い。また、一番狭い入力形式を採用し、採用した入力形式に合致しない入力値例は不正な例と扱っても良い。
【0091】
全てを包含するように入力形式を決める場合、大分類が同じであれば、入力形式の詳細を統合する。大分類が異なる場合には、最も多い大分類に合わせ、その大分類に合わない入力値例は、選択された大分類に合わせて、再度、入力形式を推定しなおす。
【0092】
例えば入力値例「10:30」は、これだけ見れば『時刻』だが、『英数字』と見なすこともできるので、一番多い大分類が『英数字』の場合には『英数字』としてその後の詳細な形式を推定すれば良い。大分類がどうしても合わず、推定しなおすことが不可能な場合には、大分類Gを1つ選択し、それに合致しない入力値例は不正な例と扱っても良い。または、入力形式のORも入力形式として用いる場合は、ORでつないだ結果を大分類の推定結果としても良い。
【0093】
ステップST606において、形式推定部6は、選択した大分類Gについて、大分類Gに合致した入力値例(E1,E2,…,Em)の各々で入力形式の詳細を推定、統合する。
【0094】
補足すると、大分類Gが決まったら、大分類G毎に対応する入力値例を用いて入力形式の詳細を推定する。例えば、大分類Gが『数値(十進数)』であれば、+や-のような符号はあるか、小数点の前の文字数は何文字か(つまり整数部は何桁か)、小数点の後の文字数は何文字か(つまり小数部は何桁か)といった詳細を決定する。
【0095】
また大分類Gが『英数字』であれば、各文字を英字であれば『A』に、数字であれば『D』に、その他記号であれば『S』に置換することで英数字のパターンを得ることができる。
【0096】
大分類Gが『単語』の場合、入力値例をそのまま単語の表記とする。例えば、
図4に示す単語リスト2bに新たなグループを追加し、グループ名は新しいものを設定し、単語の表記に入力値例を設定する。読み、読み上げの内容は前述した方法で自動生成し設定する。詳細な入力形式は『単語_(グループ名)』とすれば良い。
【0097】
ステップST607において、形式推定部6は、使用した入力値例(E1,E2,…,Em)の数に応じて、入力形式の詳細を調整する。これによって1つの入力形式が得られる。
【0098】
補足すると、入力値例毎に推定した詳細を大分類毎に統合する。全てを包含するように入力形式を決める場合の入力形式の詳細の統合は、例えば以下のように行う。
【0099】
数値の場合、例えば大分類が『数値(十進数)』で、推定された個別の入力形式が「十進数_3_2(整数部3桁、小数部2桁)」と「十進数_3_1(整数部3桁、小数部1桁)」であれば、小数部は1桁でも2桁でもよい。このため、統合した入力形式は、「十進数_3_1~2(整数部3桁、小数部1~2桁)」となる。
【0100】
英数字の場合、例えば、大分類が『英数字』で、推定された個別の入力形式が「英数字_AAADDSA」と「英数字_AADDDS」であれば、3文字目は英字でも数字でも良く、最後の英字は無くても良い。このため、統合した入力形式は「英数字_AA$DDSA?」となる。
【0101】
単語の場合、例えば、大分類が『単語』で、推定された個別の入力形式が「単語_1」と「単語_2」であれば、単語リストのグループを統合した新しいグループを作成し、そのグループを用いた入力形式とする。すなわち、グループ「1」の単語リストとグループ「2」の単語リストを統合した新しいグループ「3」を作成し、単語グループ「3」に「1」の単語、「2」の単語を全て追加する。そして統合した形式は「単語_3」を用いる。この際、単語グループ「1」や「2」を参照する入力形式が無くなった場合は、グループ「1」と「2」の単語は単語リスト2bから取り除く。
【0102】
このように統合することで、最終的な入力形式の詳細が得られる。なお、統合方法はこれに限らず、多数決を取って一番多い入力形式1つを選択する、としても良い。
【0103】
一方、ステップST604において、形式推定部6は、入力形式のORが許容される場合には、ステップST608に進む。
【0104】
ステップST608において、形式推定部6は、それぞれの大分類のORをとる。例えば、形式推定部6は、入力形式の大分類(G1,G2,…,Gm)のユニークをとり(重複を除き)、得られた大分類をORで連結させることで、ORの大分類G1|G2|…|Gkを得る(k≦m)。また、形式推定部6は、ORの大分類G1|G2|…|Gkのそれぞれの大分類Gjに対応する入力値例をデータ記憶部2等のメモリに記憶する(j≦k)。
【0105】
ステップST608の後、形式推定部6は、ORの要素となる大分類Gj毎に、ループ処理をステップST609からステップST613の間で実行する。当該ループ処理は、前述同様のステップST610~ST611と、ステップST612とを含んでいる。
【0106】
ステップST610では、形式推定部6が、大分類Gjについて、対応する入力値例から入力形式の詳細を決定する。なお、ステップST610は、ステップST606と同様に実行される。
【0107】
ステップST611では、形式推定部6が、使用した入力値例の数に応じて、入力形式の詳細を調整する。なお、ステップST611は、ステップST607と同様に実行される。
【0108】
ステップST612では、形式推定部6が、入力値例に対応する大分類Gjを、入力形式の詳細で置き換える。これによって、大分類Gjに対応する1つの入力形式が得られる。以上のステップST609~ST613のループ処理が大分類Gj毎に実行される。
【0109】
ステップST607又はST613の後、ステップST614において、形式推定部6は、入力手順3aの各々の手順(O1,O2,…,On)の入力形式を、得られた入力形式に更新(設定)する。
【0110】
なお、範囲選択部5においてユーザにより選択された範囲が少なく、入力値例が少ない場合は、その入力値例のみで入力形式を決めると、入力形式が細かくなりすぎる可能性がある。前述したように、細かすぎる入力形式は音声入力を行うユーザの利便性を損なう可能性がある。例えば入力値例「12.34」の1つのみが与えられた場合、それを以て入力形式は「十進数_2_2」となる。
【0111】
しかし音声入力者によっては、「12.30」の「0」を省略して「12.3」のような数値が発話される可能性がある。入力値例が「12.30」や「12.3」を含んでいればよいが、そうとは限らない。また逆に入力値例が「12.3」のみ与えられたが、実は「12.30」も入力する必要があるといったこともある。
【0112】
このような例を吸収するため、範囲選択された内で取得された入力値例が少ない場合は、入力形式を緩めて良い。すなわち十進数であれば桁数を1桁減らしたもの、増やしたものも含める(「十進数_M_N」→「十進数_(M-1)~(M+1)_(N-1)~(N+1)」など)、英数字であれば英字のみのパターン部分を英字または数字のパターンに置換する(「英数字_AAA」→「英数字_$$$」など)、等すれば良い。
【0113】
以上のように入力形式を推定したら、現在注目している入力手順(範囲選択された項目を入力対象項目としている入力手順)の入力形式を更新する。
【0114】
これにより、連結を許容しない場合のステップST6の形式推定処理が終了する。
【0115】
(連結を許容する場合:
図18)
図18に、連結がある場合の形式推定処理のフローチャートを示す。
【0116】
ステップST621~ST624において、形式推定部6は、選択範囲の入力値例(E1,E2,…,Em)の各々について、ループ処理を実行する。当該ループ処理は、ステップST622~ST623を含んでいる。
【0117】
ステップST622において、形式推定部6は、入力値例Eiをスペースで分割し、入力値例Eiの部分e1,e2,…,eilとする。添字「il」は、入力値例Eiに含まれる部分eの個数を表す。例えば、入力値例Eiを3分割した場合、il=3である。
【0118】
ステップST623において、形式推定部6は、入力値例Eiの部分e1,e2,…,eilの各々について合致する大分類G1
i,G2
i,…,Gil
iを選択する。
【0119】
補足すると、単純な『数値』や『単語』などだけでなくその組み合わせ(連結やOR)も入力形式として許容する場合は、まず入力値例Eiをスペースで区切り、その個々の部分e1,e2,…,eilについて合致する大分類G1
i,G2
i,…,Gil
iを探す。
【0120】
例えば、入力値例Eiが「2023/03/07 火 13:00」であれば、「2023/03/07」の部分e1が『日付』の大分類G1
iと、「火」の部分e2が『単語』の大分類G2
iと、「13:00」の部分eilが『時刻』の大分類Gil
iと合致する。入力値例が1つの場合は、複数ある大分類のうち、一番優先度が高いものを選択すればよく、この後は前述と同様に、大分類毎に詳細な形式を推定すればよい。
【0121】
ステップST624において、形式推定部6は、選択した大分類G1
i,G2
i,…,Gil
iを連結したものを大分類連結のリストに追加する。例えば、『日付』『単語』『時刻』を連結した『日付、単語、時刻』を大分類連結のリストに追加する。大分類連結G1
i,G2
i,…,Gil
iの区切り部分に対する、入力値例Eiの部分として、『日付』から「2023/03/07」の部分e1が、『単語』から「火」の部分e2が、『時刻』から「13:00」の部分eilが得られる。なお、「大分類連結」は、必ずしも連結する必要はないので、「大分類の組み合わせ」と呼んでもよい。
【0122】
形式推定部6は、以上の処理を入力値例Eiの分だけ繰り返すように、ステップST621~ST624のループ処理を実行する。
【0123】
しかる後、ステップST625~ST629において、形式推定部6は、大分類連結のリストに2つ以上連結がある場合、ループ処理を実行する。当該ループ処理は、ステップST626~ST628を含んでいる。
【0124】
ステップST626において、形式推定部6は、大分類連結のリストから2つの大分類連結を取り出す。また、形式推定部6は、取り出した2つの大分類連結(G1
i,G2
i,…,Gil
i),(G1
j,G2
j,…,Gjl
j)に対して、差分アルゴリズムを適用する。
【0125】
例えば、複数の入力値例がある場合、大分類連結の内容が入力値例の間で異なることがある。例えば、入力値例が「A12C 黒 12.3」「A12M 白 45.6」「B23F 赤」の場合、大分類の連結の候補は『十六進数、単語、十進数』『英数字、単語、十進数』『十六進数、単語』の3つになる。これに対し、できるだけ合致が多くなるように大分類を選択する。
【0126】
候補のうち2つを大分類連結のリストから取り出し、部分列にORを含む差分の算出問題と見なし、既存の差分アルゴリズムを用いて大分類の並びを決定することができる。なお、差分アルゴリズムとしては、例えば、diff等に用いられる、編集距離、LCS(最長共通部分列、Longest Common Subsequence)、SES(Shortest Edit Script)を算出することで配列間の差分を見つけ出すアルゴリズムが適宜、使用可能となっている。
【0127】
差分アルゴリズム結果としては各文字に対して「同一」「追加」「削除」「置換」のどれかが得られる。各大分類(またはそのOR)を文字として差分アルゴリズムを用いて、距離が一番小さなものを選択する。
【0128】
大分類同士の置換コストは、どちらかがどちらかに包含されれば0(つまり同じと見なす、『十進数|英数字』と『英数字』や、『十六進数』と『英数字』など)、包含されなければ1とすれば良い。
【0129】
また、2つの大分類連結『十六進数、単語、十進数』と『英数字、単語、十進数』に差分アルゴリズムを適用すると、『十六進数と英数字の置換、単語、十進数』が差分情報として得られる。
【0130】
また、ステップST627において、形式推定部6は、当該取り出した2つの大分類連結(G1
i,G2
i,…,Gil
i),(G1
j,G2
j,…,Gjl
j)を、大分類連結のリストから削除する。
【0131】
ステップST628において、形式推定部6は、差分アルゴリズムを適用した結果として得られた差分情報を用いて差分を吸収し、1つの大分類の連結(G1
i,j,G2
i,j,…,Gi,jl
i,j)を作成する。
【0132】
例えば、形式推定部6は、前述した差分情報『十六進数と英数字の置換、単語、十進数』に対して、差分の吸収を行い、「置換」「追加」「削除」の部分を大分類の組み合わせに変換する。例えば『十六進数と英数字の置換、単語、十進数』では置換部分を包含関係の部分を広い方に直すと『英数字、単語、十進数』となる。このように包含関係のある『○○と××の置換(○○が××に包含される)』は『××』とすれば良い。
【0133】
包含関係のない『○○と××の置換』が出てきた場合は、OR、すなわち『○○|××』とすれば良い。
【0134】
また、『○○の追加』や『××の削除』は、オプショナルな大分類、すなわち『(○○)』や『(××)』とすれば良い。
【0135】
この際、どの大分類にどの入力値例のどの部分が合致するのかは記録しておく。
【0136】
しかる後、形式推定部6は、当該作成した大分類の連結(G1
i,j,G2
i,j,…,Gi,jl
i,j)を大分類連結のリストに追加する。
【0137】
形式推定部6は、以上の処理を最終的に1つの大分類の連結だけが残るまで繰り返すように、ステップST625~ST629のループ処理を実行する。
【0138】
しかる後、ステップST630~ST633において、形式推定部6は、残った大分類の連結(G1
i,G2
i,…,Gil
i)における各々の大分類Giについて、入力形式の詳細を得るように、ループ処理を実行する。当該ループ処理は、ステップST631~ST632を含んでいる。
【0139】
ステップST631において、形式推定部6は、大分類Giに対応する入力値例Eiの部分の集合(ei1,ei2,…,eim)から入力形式の詳細を決定する。
【0140】
上記の例の場合、残った大分類Giの連結は『英数字、単語、(十進数)』となる。ここで、『英数字』の大分類Giに合致する入力値例Eiは「A12C」「A12M」「B23F」であり、『単語』の大分類Giに合致する入力値例Eiは「黒」「白」であり、『十進数』の大分類Giに合致する入力値例Eiは「12.3」「45.6」である。後は大分類Gi毎にそれに合致する入力値例Eiから、詳細な形式を推定すればよい。上記の例では最終的に『英数字_ADDA、単語_1、(十進数_2_1)』となり、単語_1の単語リストは「黒」「白」となる。
【0141】
ステップST632において、形式推定部6は、入力値例Eiの部分の集合(ei1,ei2,…,eim)の数(使用した入力値例Eiの数)で詳細を調整する。しかる後、形式推定部6は、得られた詳細により、大分類Giを置き換える。
【0142】
形式推定部6は、以上の処理を各々の大分類Giごとに繰り返すように、ステップST630~ST633のループ処理を実行する。
【0143】
ステップST634において、形式推定部6は、以上のように得られた入力形式を、対応する複数の入力手順の入力形式に設定する。なお、ステップST634において、入力値例が少ない場合、ステップST614と同様に入力形式を緩めてよい。いずれにしても、以上により、連結を許容する場合のステップST6の形式推定処理が終了する。
【0144】
(形式チェック処理)
以下の形式チェック処理では、音声合成を用いた形式チェックについて説明する。形式チェック処理は形式チェック部7で説明した通り、入力形式から入力値例を生成して音声合成で音声データを生成し、入力形式から生成した音声認識辞書を用いて音声認識し、誤認識が起こるかどうかで形式チェックをする。
【0145】
図19に、形式チェック処理のフローチャートを示す。
【0146】
ステップST701において、形式チェック部7は、最初に注目している入力形式から辞書生成部8によって音声認識辞書を生成する。
【0147】
ステップST702において、形式チェック部7は、推定された入力形式から複数の入力値例を生成する。例えば、入力形式から生成可能な入力値例の部分のうち、複数の候補が生成可能な部分については、乱数によって候補を選択すれば良い。例えば『数値』の場合、入力形式「十進数_2~4_1」であれば、入力値例の整数部の桁数を2~4から乱数で選択し、各桁の数字を乱数で0~9に決めればよい(ただし先頭桁数は1~9)。
【0148】
また『英数字』の場合、入力形式「英数字_AA$D?」であれば、入力値例の1文字目、2文字目を「A-Za-z」から1文字選択し、3文字目を「A-Za-z0-9」から1文字選択し、4文字目を乱数によって含めるか含めないかを決定する。入力値例の4文字目に乱数を含める場合には「0-9」から1文字を選択すればよい。その他の大分類でも同様に乱数を用いて複数の入力値例を生成することができる。
【0149】
ステップST703において、形式チェック部7は、空の誤認識リストを作成する。空の誤認識リストは、誤認識のタイプと、入力値例と、詳細情報とを含むリストである。誤認識のタイプとしては、例えば、コマンド誤検出と、誤認識とが適宜、使用可能となっている。詳細情報としては、例えば、タイプがコマンド誤検出の場合、当該コマンドが使用可能となっている。また例えば、タイプが誤認識の場合、詳細情報としては、例えば、認識結果と、誤り箇所とが適宜、使用可能となっている。
【0150】
しかる後、ステップST704~ST711において、形式チェック部7は、生成した入力値例の各々について音声認識による形式チェックを行うように、ループ処理を実行する。当該ループ処理は、ステップST705~ST710を含んでいる。
【0151】
ステップST705において、形式チェック部7は、生成した入力値例毎に、音声合成し、音声合成結果としての音声データを得る。
【0152】
ステップST706において、形式チェック部7は、音声合成結果の音声データに対し、生成した音声認識辞書を用いて音声認識を行う。このとき、形式チェック部7は、音声認識辞書を用いて、入力値例の音声認識と、コマンドの音声認識とを行う。音声認識辞書としては、入力値例に関する第1の辞書と、コマンドに関する第2の辞書とをそれぞれ用いてもよい。第1及び第2の辞書を用いる場合、形式チェック部7は、入力値例の音声認識と、コマンドの音声認識とを別々に実行する。あるいは、音声認識辞書としては、入力値例及びコマンドの両者に関する辞書を用いてもよい。両者に関する辞書を用いる場合、形式チェック部7は、入力値例の音声認識と、コマンドの音声認識とを同時に実行する。なお、ステップST706の認識結果としては、(1)入力値例が認識された場合と、(2)入力値例が認識されずにコマンドが誤検出された誤認識の場合と、(3)コマンド誤検出以外の誤認識の場合と、の3通りがある。なお、上記(1)の場合には、音声認識が成功している。上記(2)又は(3)の場合には、音声認識が失敗している。また、上記(2)のコマンドが誤検出された場合、すなわちコマンドが認識結果として得られた場合、その入力値例を発話すると誤ってコマンドが認識されてしまうことを表す。
【0153】
ステップST707において、形式チェック部7は、音声認識の認識結果のテキストと、入力値例とが合致したか否かを判定し、合致した場合には音声認識が成功したので、ステップST711に進む。また、判定の結果、否の場合には音声認識が失敗したので、ステップST708に移行する。
【0154】
ステップST708において、形式チェック部7は、音声認識が失敗した理由が、コマンドの誤検出だったか否かを判定し、コマンドの誤検出だった場合にはステップST709に移行し、否の場合にはステップST710に移行する。ステップST708によれば、ステップST707にて音声認識が失敗した場合に、コマンド誤検出による失敗だったかどうかといった状況を分類できる。
【0155】
ステップST709において、形式チェック部7は、音声認識の認識結果として、コマンドが認識されたため、コマンド誤検出に関する情報を誤認識リストに追加し、ステップST711に進む。
【0156】
ステップST710において、形式チェック部7は、音声認識の認識結果として、コマンド誤検出以外の誤認識のため、誤認識に関する情報を誤認識リストに追加し、ステップST711に進む。
【0157】
ステップST711では、形式チェック部7は、全ての生成した入力値例について、ステップST705~ST710の処理を行った後、ステップST704~ST711のループ処理を終了する。
【0158】
ステップST712において、形式チェック部7は、誤認識リストにコマンド誤検出の情報があるか否かを判定し、コマンド誤検出の情報がある場合にはステップST714に移行し、否の場合にはステップST713に移行する。
【0159】
ステップST713において、形式チェック部7は、誤認識リスト内の誤認識の数を入力値例の数で除算することで誤認識率を算出し、誤認識率が閾値以上か否かを判定する。形式チェック部7は、判定の結果、誤認識率が閾値以上の場合にはステップST714に移行し、否の場合にはステップST715に移行する。
【0160】
ステップST714において、形式チェック部7は、コマンド誤検出の情報があるか、又は誤認識率が高いため、形式チェック結果の通知が必要であるとして、形式チェック結果に相当する誤認識リストを表示部12に通知して処理を終了する。
【0161】
ステップST715において、形式チェック部7は、誤認識リストが空であるか、又は誤認識率が低いため、形式チェック結果の通知を不要として処理を終了する。
【0162】
(音声入力処理)
情報処理装置1は、入力手順作成処理により得られた入力手順3aに基づいて、別の音声入力者と共に、
図20に示すように、音声入力処理を実行する。
【0163】
ステップST21において、情報処理装置1の認識制御部11は、入力手順3aの手順番号毎に、実施済みか否かのフラグ(=実施フラグ)を追加し、全ての実施フラグをOFFに設定する。
【0164】
ステップST22において、認識制御部11は、手順番号の実施フラグがOFFの入力手順3aにあるか否かを判定し、否の場合には音声入力処理を終了する。一方、ステップST22の判定の結果、認識制御部11は、実施フラグがOFFの手順番号が入力手順3aに残っている場合にはステップST23に移行する。
【0165】
ステップST23において、認識制御部11は、実施フラグがOFFの手順番号のうち、最先の手順番号の行に対応する手順を入力手順3aから取り出す。
【0166】
ステップST24において、辞書生成部8は、認識制御部11の制御により、取り出した手順に設定された入力形式から音声認識辞書を生成する。
【0167】
ステップST25において、音声合成部10は、認識制御部11の制御により、取り出した手順に含まれるガイダンスを音声合成し、得られた音声データをスピーカーから再生する。
【0168】
ステップST26において、音声認識部9は、認識制御部11の制御により、音声入力者の発話を待つ。このとき、適宜、音声入力者の発話が行われる。
【0169】
ステップST27において、音声認識部9は、認識制御部11の制御により、音声入力者の発話に対して音声認識辞書を用いて音声認識を行う。
【0170】
ステップST28において、認識制御部11は、音声認識の結果、コマンドが認識されたか否かを判定し、コマンドが認識された場合にはステップST29に移行し、否の場合にはステップST30に移行する。
【0171】
ステップST29において、認識制御部11は、認識されたコマンドを実行し、ステップST22に戻る。
【0172】
ステップST30において、認識制御部11は、コマンドを含まない認識結果のテキストを音声合成し、得られた音声データをスピーカーにより再生させる。これにより、音声入力者の発話内容がスピーカーにより復唱される。
【0173】
ステップST31において、認識制御部11は、認識結果のテキストが表す値を、取り出した手順に含まれる入力対象項目の識別子に基づいて、帳票データ2aの入力欄に入力する。
【0174】
ステップST32において、認識制御部11は、当該手順の実施フラグをONにして、ステップST22に戻る。
【0175】
以下、全ての実施フラグがONになるまで、認識制御部11は、入力手順3aのリストに含まれる全ての手順を実施していく。
【0176】
なお、以上の音声入力処理は一例であり、手順番号の手順を実施するごとに音声認識辞書を生成しているが、これに限定されない。例えば、音声認識辞書を最初に一括で生成しておき、音声認識の際に必要な辞書を取り出して用いてもよい。また、復唱が無くても良い。あるいは、認識結果を復唱後、音声入力者に対してシステムから「これでよろしいですか」といった確認を取り、OKの場合のみ入力を実行し、NGの場合にはステップST26の発話から手順を再実行する、といった確認処理を含んでも良い。この場合、誤認識による誤った値の入力を防ぐことができる。
【0177】
上述したように第1の実施形態によれば、入力値例取得部4は、項目ごとに、音声入力の入力欄を含む帳票データ2aから、1つ以上の項目と、1つ以上の項目に対する入力欄の値に関する情報である入力値例を取得する。形式推定部6は、入力値例に基づいて、入力欄の入力形式を推定する。このように、入力欄の入力値例に基づいて、入力欄の入力形式を推定する構成により、音声認識の専門家が不在の場合でも、適切な入力形式を定めることができる。
【0178】
補足すると、従来の場合、予め入力できる値の形式を定めておき、それに基づいて音声認識を行う。一般に、入力形式に基づいた音声認識を行うことで、設定された入力形式以外の発話の認識結果をリジェクトする、騒音で認識されてしまった認識結果をリジェクトする、といったことが可能となり、音声認識の精度を高めることができる。そのため、適切な入力形式を設定することは重要である。
【0179】
しかしながら、従来の場合、音声認識の専門家以外の作業者が適切な入力形式を決めることは難しく、適切な入力形式を全ての入力項目に対して設定するには非常に時間がかかる。
【0180】
これに対し、第1の実施形態によれば、前述した通り、音声認識の専門家が不在の場合でも、適切な入力形式を定めることができる。なお、入力欄の値に関する情報は、入力値例に限らず、後述する書式設定としてもよい。このように実施しても、前述した効果と同様の効果を得ることができる。
【0181】
また、第1の実施形態によれば、帳票データ2aに含まれる複数の入力欄に値を入力するための入力手順3aが入力手順記憶部3に保持されている。入力手順3aは、帳票データ2aに含まれる入力対象項目の入力欄を識別する識別子と、推定された入力形式とを含んでいる。従って、前述した効果に加え、帳票データ2aとは別に、入力手順3aを管理することができる。なお、入力手順3aは、情報処理装置1のメモリに限らず、情報処理装置1に通信可能なデータベース装置が保持してもよく、帳票データ2aの別シートが保持してもよい。また、入力手順3aは、識別子及び入力形式の他、手順番号、ガイダンス、基準値、手順のグループ名、などを適宜、含んでもよい。このように変形しても、前述同様に、帳票データ2aとは別に、入力手順3aを管理することができる。
【0182】
また、第1の実施形態によれば、範囲選択部5は、帳票データ2aから複数の入力欄の範囲を選択する。入力値例取得部4は、選択された範囲の入力欄に対応して入力値例を取得する。形式推定部6は、対応して取得された入力値例に基づいて、範囲の入力欄に共通する入力形式を推定する。従って、前述した効果に加え、複数の入力欄の範囲を選択する構成により、個々の入力欄を選択する場合に比べ、入力値例を取得する手間を軽減させることができる。
【0183】
また、第1の実施形態によれば、辞書生成部8は、推定された入力形式に基づいて音声認識辞書を生成する。認識制御部11は、ユーザの発話に対して音声認識辞書を用いて音声認識を実行し、得られた音声認識結果のテキストを、入力欄の識別子に応じて入力欄に入力する。従って、前述した効果に加え、ユーザの発話に対する音声入力を実行することができる。
【0184】
また、第1の実施形態によれば、入力欄の値に関する情報は、入力欄の値の例である入力値例である。入力値例取得部4は、入力欄の値が予め入力された帳票データ2aと、入力欄への値の入力を受け付けるユーザインタフェースとのうちの少なくとも一方から当該値を入力値例として取得する。従って、前述した効果に加え、様々な取得元から入力値例を取得することができる。
【0185】
また、第1の実施形態によれば、形式推定部6は、範囲の入力欄ごとに入力形式を推定し、推定された入力形式のうちの1つの入力形式を共通する入力形式として推定してもよい。この場合、前述した効果に加え、例えば、複数の入力形式のうちの一方が他方を包含する場合に、最も狭い入力形式を採用することで、入力形式を統合することができる。
【0186】
また、第1の実施形態によれば、形式推定部6は、範囲の入力欄ごとに入力形式を推定し、推定された入力形式のうちの複数を包含した入力形式を共通する入力形式として推定してもよい。この場合、前述した効果に加え、例えば、複数の入力形式の全てを包含するように入力形式を決めることで、入力形式を統合することができる。
【0187】
また、第1の実施形態によれば、形式推定部6は、対応して取得された入力値例の数に基づいて、推定した入力形式を調整する。従って、前述した効果に加え、選択された範囲(セル数)が少ない場合には、入力形式の桁数を増やす(+1桁許す)等のように、入力形式を少し緩めることで、ユーザの利便性を維持することができる。
【0188】
また、第1の実施形態によれば、入力手順3aは、入力欄の値の範囲を示す上下限値(基準値)を更に含んでいてもよい。形式推定部6は、入力手順3aに含まれる上下限値に基づいて、推定した入力形式を調整してもよい。この場合、上下限値の条件を満たすように、少し緩めに入力形式を修正する等の調整ができるので、より適切な入力形式を推定することができる。
【0189】
また、第1の実施形態によれば、入力手順3aは、入力欄への音声入力に関するガイダンスを更に含んでいる。形式チェック部7は、推定された入力形式を、ガイダンスに基づいてチェックする。従って、前述した効果に加え、推定した入力形式をガイダンスによりチェックする構成により、推定した入力形式の精度を向上させることができる。例えば、ガイダンスの文言が「○○時刻」であるのに対し、入力形式が時刻形式でない場合、といった妥当性のない入力形式をチェックすることができる。また例えば、複数の項目への入力欄の入力形式を入力値例から推定し、入力形式の妥当性のチェックを行うため、音声認識の専門家でなくても適切な入力形式を設定でき、手動で入力形式を検討するのと比較して入力手順作成にかかる時間を短縮できる。
【0190】
なお、これに限らず、形式チェック部7は、形式チェックのためのルールを用いることで、入力形式をチェックしてもよい。もしくは、形式チェック部7は、既存のデータを用いて機械学習モデルを機械学習することにより、得られた学習済みモデルとして実装してもよい。ここで、既存のデータとしては、例えば、入力値例と入力値例から推定された入力形式とを含む入力データと、推定された入力形式のチェック結果を含む出力データとを備えたデータセットが使用可能である。このように変形しても、推定された入力形式をチェックできるため、推定した入力形式の精度を向上させることができる。
【0191】
また、第1の実施形態によれば、形式チェック部7は、推定された入力形式から入力値例を生成し、生成した入力値例を音声合成し、音声合成して得た音声データに対して音声認識辞書を用いて音声認識を実行する。形式チェック部7は、得られた音声認識結果のテキストと生成した入力値例とが合致するか否かを判定することで、推定された入力形式をチェックする。従って、前述した効果に加え、推定した入力形式を音声認識によりチェックする構成により、推定した入力形式の精度を向上させることができる。
【0192】
また、第1の実施形態によれば、形式チェック部7は、判定した結果、音声認識結果のテキストからコマンドが検出されたか否かを判定することで、合致しない場合の状況を分類してもよい。この場合、コマンドの誤検出がないことを確認することで、入力形式の妥当性をチェックすることができる。
【0193】
また、第1の実施形態によれば、形式チェック部7は、判定した回数と判定した結果とに基づき、音声認識の認識率又は誤認識率を算出することで、入力形式をチェックする。例えば、誤認識と判定した結果を、入力値例の数である判定した回数で除算することで誤認識率を算出してもよい。あるいは、認識成功と判定した結果を、入力値例の数である判定した回数で除算することで認識率を算出してもよい。この場合、前述した効果に加え、入力形式の妥当性を統計的にチェックすることができる。
【0194】
また、第1の実施形態によれば、形式チェック部7は、入力形式をチェックした結果を識別可能に通知する。従って、前述した効果に加え、音声認識を失敗した状況がコマンド誤検出によるものか否かを通知する構成により、音声認識を失敗した状況に応じて、ユーザに適切な対応を促すことができる。なお、これに限らず、形式チェック部7は、認識率低下の懸念がある旨を通知してもよく、認識率低下の要因(コマンドとのバッティング、認識率の低い手順、よく間違えている文字等)を通知してもよい。例えば、「9」と「Q」といった同音異字の例を通知してもよい。このようにしても、音声認識を失敗した状況に応じて、ユーザに適切な対応を促すことができる。
【0195】
また、第1の実施形態によれば、形式チェック部7は、コマンドが検出された場合に、当該コマンドに一致する、音声入力のコマンドを変更してもよい。この場合、コマンドとのバッティングを、コマンドの文言を変更することで解消できるので、コマンドの誤検出による不測の事態を回避することができる。
【0196】
また、第1の実施形態によれば、表示部12は、帳票データ2aを表示し、且つ帳票データ2aに含まれる入力欄に、推定された入力形式を表示してもよい。同様に、表示部12は、推定された入力形式から1つ以上の入力値例を生成し、生成した入力値例を帳票データ2aに含まれる入力欄に表示してもよい。また同様に、表示部12は、推定された入力形式から入力欄に入力できる値の範囲を生成し、生成した範囲を帳票データ2aに含まれる入力欄に表示してもよい。従って、前述した効果に加え、推定された入力形式やその入力形式から生成される入力値例を帳票データ2a上に表示するため、帳票データ2a上の入力位置と入力形式・入力値例を一覧して確認することができる。これに伴い、推定された入力形式を帳票と共に一覧性高く表示するとともに、入力形式のチェックを自動で行うことができる。
【0197】
補足すると、従来は、入力形式を決めた後にも、入力形式と入力対象項目の表示が離れているため一覧性が低く、また設定された入力形式が本当に適切かどうか入力形式を見て判断することは難しい。そのため、従来の場合、入力形式が適切かどうかをチェックするためには実際に入力を試してみる必要があり、さらに時間がかかってしまう。
【0198】
これに対し、第1の実施形態によれば、例えば
図12に示すように、入力形式と入力対象項目の表示が近接しているため一覧性が高く、また、設定された入力形式が適切かどうかを入力形式を見て容易に判断することができる。
【0199】
また、第1の実施形態によれば、入力手順3aは、帳票データ2aに含まれる入力対象項目の入力欄を識別する識別子と、推定された入力形式と、帳票データ2aに含まれる複数の入力欄に値を入力する順序(手順番号)とを含んでいる。表示部12は、帳票データ2aを表示し、且つ入力手順3aに基づいて、帳票データ2aに含まれる複数の入力欄に、値を入力する順序を重畳表示する。従って、前述した効果に加え、入力の順序が正しく設定されたかどうかをユーザに視認させることができる。なお、これに限らず、表示部12は、入力手順3a内の情報(ガイダンス、基準値)を帳票データ2aに重畳表示してもよい。これにより、前述同様に、入力手順3a内の情報(ガイダンス、基準値)が正しく設定されたかどうかをユーザに視認させることができる。
【0200】
<第2の実施形態>
第1の実施形態では、入力手順作成者の操作に応じて、範囲選択部5が帳票データ2a上で入力形式を推定する範囲を選択していた。これに対し、第2の実施形態では、範囲選択部5が自動で範囲を選択することで、当該選択した範囲の入力形式を推定して入力手順3aに設定する動作を全て自動で行う。すなわち、範囲選択部5は、第1の実施形態とは異なり、自動で同じ入力手順が設定されるべき複数の範囲を推定する。
【0201】
これに伴い、範囲選択部5は、
図21に示すように、前述した機能に加え、入力手順3a内のガイダンスを用いた範囲選択と、入力手順3a内の入力対象項目の位置を用いた範囲選択との少なくとも一方を実行する。
【0202】
範囲選択部5は、例えば、同一文言のガイダンスに対応する入力欄の範囲を選択する等のように、ガイダンスに基づいて、入力欄の範囲を選択する。具体的には、範囲選択部5は、入力手順3aに含まれる同一のガイダンスに対応する入力欄の範囲を1範囲としてもよい。
【0203】
項目位置を用いた範囲選択の場合、範囲選択部5は、入力対象項目の入力欄の識別子が近い位置を示す状況に基づいて、入力欄の範囲を選択する。具体的には、範囲選択部5は、入力手順3aに含まれる入力対象項目の識別子が隣接する入力欄を示す場合、当該識別子が識別する入力欄の範囲を1範囲としてもよい。ただし、入力対象項目の入力欄から入力値例を取得し、入力値例の1つについて形式推定部6で入力形式を推定し、同じ入力形式となる入力欄がN以上隣接する場合のみ、入力欄の範囲に含めることが好ましい(Nは予め定めた閾値)。
【0204】
図22に、帳票データ2aと入力値例、入力手順のリストと、それらに基づいて選択された範囲を図示する。例えばB1-D1、B2-D2、…、B5-D5はガイダンスが共通(それぞれ「検査時刻」、「起動電流」、…、「外観」)なので、それぞれ1範囲rg1、rg2、…、rg5とする。B8-D9については、B8-B9、C8-C9、D8-D9はそれぞれガイダンスが同じ(「騒音、位置1」、…、「騒音、位置3」)であるため、破線で示すように、1範囲rg81、…、rg83とする。更に入力済みの入力値例から推定される入力形式が十進数_2_1の項目がB8-D8と隣接しているため、全て合わせるとB8-D9は、一点鎖線で示すように、1範囲rg89となる。
【0205】
他の構成は、第1の実施形態と同様である。
【0206】
次に、以上のように構成された情報処理装置の動作について
図23のフローチャートを用いて説明する。
【0207】
いま、前述同様に、入力形式以外の入力手順を作成するステップST1が実行される。
【0208】
ステップST1の後、ステップST3aにおいて、範囲選択部5は、例えば、ガイダンスに基づいて、入力欄の範囲を選択する。また、範囲選択部5は、例えば、入力手順3aに含まれる入力対象項目の識別子に基づいて、入力欄の範囲を選択する。具体的には例えば、範囲選択部5は、入力対象項目の識別子が隣接する入力欄を示す場合、当該隣接する入力欄の範囲を選択する。この際、どの範囲にも属さない入力欄に対応する入力対象項目は、単独の1項目からなる範囲とする。
【0209】
ステップST3aの後、選択された範囲(選択範囲)におけるループ処理がステップST3bからステップST3dの間で実行される。当該ループ処理は、前述同様のステップST4~ST7と、ステップST3cとを含んでいる。
【0210】
ステップST4は、選択された範囲内の手順を入力手順3aから取り出す処理である。
【0211】
ステップST5は、取り出した手順の入力値例を帳票データ2aから取得する処理である。
【0212】
ステップST6は、取得した入力値例から入力形式を推定する処理である。
【0213】
ステップST7は、推定した入力形式をチェックする処理である。
【0214】
ステップST7の後、ステップST3cにおいて、形式推定部6は、形式チェックの結果が要通知だったとしてもその場では通知せず、形式チェック処理結果を加算していく。すなわち、形式推定部6は、形式チェック処理におけるコマンド誤検出の回数、誤認識の回数を加算し、誤認識リストについてはマージする。
【0215】
各範囲に対するループ処理の後、形式チェック部7は、前述同様にステップST8,ST9を実行する。これにより、形式チェック部7は、形式チェック処理の加算結果を参照し、コマンド誤検出があるか否か、誤認識率が閾値以上かどうかに応じて表示部12から入力手順作成者に通知を行う(ステップST9)。
【0216】
以下、前述同様に、ステップST10以降の処理が実行される。これにより、入力手順の作成処理が終了する。
【0217】
上述したように第2の実施形態によれば、入力手順3aは、入力対象項目の項目名を含むガイダンスを更に含んでいる。範囲選択部5は、ガイダンス又は識別子に基づいて、入力欄の範囲を選択する。従って、前述した効果に加え、同じ入力形式を設定すべき範囲を自動で選択するため、更に入力手順3aの設定にかかる時間を短縮することができる。
【0218】
<第3の実施形態>
第1の実施形態では、入力値例に基づいて入力形式を推定した。これに対し、第3の実施形態では、帳票データ2aに設定済みの表示用の書式設定を用いて入力形式を推定する。
【0219】
これに伴い、情報処理装置1は、
図24に示すように、入力値例取得部4に代えて、書式設定取得部13を備えている。
【0220】
書式設定取得部13は、選択された範囲の書式設定を帳票データ2aから取得する。書式設定は、入力欄の値の表示に用いられる設定である。書式設定取得部13としては、例えば、既存の帳票編集アプリケーションに備えられた機能を用いればよい。例えばExcel(登録商標)では、セル(入力欄)の書式として値を表示する際に数値として表示するか、日時として表示するか、等を選択することができる。書式設定取得部13は、記録用データシートに含まれる書式設定を、入力欄の値に関する情報として取得する情報取得部の一例である。
【0221】
一方、形式推定部6は、入力値例に代えて、取得された書式設定に基づいて、入力形式を推定する。例えば、形式推定部6は、1つの書式設定から1つの入力形式への変換を機械的に行うことができる。すなわち、書式が「数値(小数点以下の桁数N)」であれば入力形式『十進数_1~_N』、書式が「日付(2012/3/14)」であれば入力形式『日付_年月日』、等である。各項目について書式設定は1つであるため、項目ごとに入力形式1つが得られる。その後、複数の入力形式の統合、選択範囲に応じた調整は、第1の実施形態と同様に実行される。
【0222】
他の構成は、第1の実施形態と同様である。
【0223】
以上のような構成によれば、
図25、
図26及び
図27に示すように、入力値例(E
1,E
2,…,E
m)に代えて、書式設定(F
1,F
2,…,F
m)を用いることにより、入力手順作成処理、形式推定処理及び形式チェック処理が前述同様に実行される。
【0224】
以上のように第3の実施形態によれば、帳票データ2aにおいて、音声入力の入力欄の値に関する情報は、入力欄の値の表示に用いられる書式設定である。書式設定取得部13は、帳票データ2aに含まれる当該書式設定を、音声入力の入力欄の値に関する情報として取得する。従って、前述した効果に加え、入力値例を別途用意する必要が無い。
【0225】
なお、第3の実施形態は、入力欄の値の例である入力値例に代えて、入力欄の値の表示に用いられる書式設定を帳票データ2aから取得したが、これに限定されない。例えば、第3の実施形態は、書式設定取得部13が、入力値例と書式設定とを含む情報を帳票データ2aから取得してもよい。この場合、書式設定取得部13は、入力値例と書式設定とを含む情報(入力欄の値に関する情報)を記録用データシートから取得する情報取得部の一例である。このような変形例によれば、第1及び第3の実施形態の作用効果を同時に得ることができる。
【0226】
<第4の実施形態>
第4の実施形態は、第1の実施形態に加え、設定された入力手順が正しく動作するかを確認するため、実際の動作例を入力手順作成者に提示する。
【0227】
これに伴い、情報処理装置1は、
図28に示すように、
図1に示した構成に加え、動作例表示部14を更に備えている。
【0228】
ここで、動作例表示部14は、音声入力者が発話して音声入力を行うのに代えて、入力値を自動生成、音声合成を用いて音声データを自動生成することで、動作例を表示する。補足すると、動作例表示部14は、推定された入力形式から入力値例を生成し、生成した入力値例を音声合成し、音声合成して得た音声データを、ユーザの発話に代えて認識制御部11に提供することで、認識制御部11による音声入力の動作例を表示する。動作例は動画として保存して動画再生で表示しても良く、帳票データ2aに重畳して表示しても良い。動作例表示部14は、帳票データ2aに動作例を重畳表示した後、動作例として帳票データ2aに入力した値を、入力手順作成者の操作に応じて、一括して削除する。
【0229】
他の構成は、第1の実施形態と同様である。
【0230】
次に、以上のように構成された情報処理装置の動作について
図29を用いて説明する。この動作は、
図20に示した音声入力処理において、ユーザによる発話と音声認識(ステップST26,ST27)に代えて、入力形式から入力値例を1つ自動生成し、それを音声合成し、合成した音声データを再生及び音声認識する点で異なる。以下、順に説明する。
【0231】
ステップST21~ST25は、前述同様に実行される。
【0232】
ステップST25の後、ステップST26aにおいて、動作例表示部14は、推定された入力形式から入力値例を生成する。
【0233】
ステップST26bにおいて、動作例表示部14は、生成した入力値例を音声合成して音声データを得る。
【0234】
ステップSTS26cにおいて、動作例表示部14は、得られた音声データを認識制御部11に提供する。認識制御部11は、音声認識辞書を用いて音声認識を実行し、得られた音声認識結果のテキストを、入力対象項目の入力欄を識別する識別子に応じて入力欄に入力する。動作例表示部14は、音声データを認識制御部11に提供することで、このような認識制御部11による音声入力の動作例を表示する。
【0235】
以下、前述同様に、ステップST28以降の処理が実行される。
【0236】
上述したように第4の実施形態によれば、動作例表示部14は、推定された入力形式から入力値例を生成し、生成した入力値例を音声合成し、音声合成して得た音声データを、ユーザの発話に代えて認識制御部11に提供することで、認識制御部11による音声入力の動作例を表示する。従って、第1の実施形態の効果に加え、設定された入力手順がどのように動作するかを実際の動作例で表示、再生するため、入力手順が適切かどうかの確認を簡単に行うことができる。
【0237】
<第5の実施形態>
第5の実施形態は、以上の各実施形態及び各変形例の具体例であり、前述した情報処理装置1をコンピュータにより実現した形態となっている。情報処理装置1は、パーソナルコンピュータ等の汎用コンピュータと、検査装置(組み込みシステム)等の専用コンピュータとのいずれで実現してもよい。
【0238】
図30は、第5の実施形態に係る情報処理装置1のハードウェア構成を例示するブロック図である。この情報処理装置1はCPU(Central Processing Unit)31と、RAM(Random Access Memory)32と、ROM(Read Only Memory)33と、ストレージ34と、表示装置35と、入力装置36と、通信装置37とを含み、それぞれバスにより接続される。
【0239】
CPU31は、プログラムに従って演算処理および制御処理などを実行するプロセッサである。CPU31は、RAM362の所定領域を作業領域として、ROM33およびストレージ34などに記憶されたプログラムとの協働により、上述した情報処理装置1の各部の処理を実行する。CPU31及びプロセッサの各々は、処理回路と呼んでもよい。
【0240】
RAM32は、SDRAM(Synchronous Dynamic Random Access Memory)などのメモリである。RAM32は、CPU31の作業領域として機能する。
【0241】
ROM33は、プログラムおよび各種情報を書き換え不可能に記憶するメモリである。
【0242】
ストレージ34は、HDD(Hard Disc Drive)等の磁気記録媒体、フラッシュメモリなどの半導体による記憶媒体、または、HDDなどの磁気的に記録可能な記憶媒体、光学的に記録可能な記憶媒体などにデータを書き込みおよび読み出しをする装置である。ストレージ34は、CPU31からの制御に応じて、記憶媒体にデータの書き込みおよび読み出しをする。ストレージ34は、コンピュータのメモリの一例である。
【0243】
表示装置35は、LCD(Liquid Crystal Display)などのディスプレイである。表示装置35は、CPU361からの表示信号に基づいて、各種情報を表示する。
【0244】
入力装置36は、マウスおよびキーボード等の入力デバイスである。入力装置36は、ユーザから操作入力された情報を指示信号として受け付け、指示信号をCPU31に出力する。
【0245】
通信装置37は、CPU31からの制御に応じて外部機器とネットワークを介して通信する。通信装置37は、通信回路と呼んでもよい。
【0246】
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した情報処理装置1の制御動作による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD-ROM、CD-R、CD-RW、DVD-ROM、DVD±R、DVD±RW、Blu-ray(登録商標)Discなど)、半導体メモリ、又はこれに類する非一時的な記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。記憶媒体は、非一時的なコンピュータ読み取り可能な記憶媒体(non-transitory computer readable storage medium)と呼んでもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の情報処理装置1の制御と同様な動作を伴う情報処理方法を実現することができる。例えば、情報処理方法は、項目ごとに、音声入力の入力欄を含む帳票データ2aから、1つ以上の項目と、1つ以上の項目に対する入力欄の値に関する情報とを取得することと、当該情報に基づいて、入力欄の入力形式を推定することと、を備えている。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
【0247】
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
【0248】
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
【0249】
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
【0250】
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
【0251】
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
【0252】
(各実施形態の変形例)
なお、各実施形態及び各変形例は、上述した情報処理装置1の各ステップを含む情報処理方法や情報処理プログラムとして表現してもよい。
【0253】
以上説明した少なくとも一つの実施形態によれば、音声認識の専門家が不在の場合でも、適切な入力形式を定めることができる。このことは、上述した少なくとも一つの変形例でも同様である。
【0254】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0255】
1…情報処理装置、2…データ記憶部、2a…帳票データ、3…入力手順記憶部、3a…入力手順、4…入力値例取得部、5…範囲選択部、6…形式推定部、7…形式チェック部、8…辞書生成部、9…音声認識部、10…音声合成部、11…認識制御部、12…表示部、13…書式設定取得部、14…動作例表示部。