特許7610803 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ネインの特許一覧 ▶ 高砂熱学工業株式会社の特許一覧

特許7610803設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-12-25

(45)【発行日】2025-01-09

(54)【発明の名称】設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム

(51)【国際特許分類】

G10L 15/22 20060101AFI20241226BHJP

G10L 13/00 20060101ALI20241226BHJP

G10L 13/02 20130101ALI20241226BHJP

G10L 15/00 20130101ALI20241226BHJP

G06F 3/16 20060101ALI20241226BHJP

【ＦＩ】

G10L15/22 200H

G10L13/00 100L

G10L13/02 130Z

G10L15/00 200L

G06F3/16 650

G06F3/16 670

【請求項の数】 6

(21)【出願番号】P 2020076810

(22)【出願日】2020-04-23

(65)【公開番号】P2021173842

(43)【公開日】2021-11-01

【審査請求日】2023-03-20

(73)【特許権者】

【識別番号】515048065

【氏名又は名称】株式会社ネイン

(73)【特許権者】

【識別番号】000169499

【氏名又は名称】高砂熱学工業株式会社

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(72)【発明者】

【氏名】山本健太郎

(72)【発明者】

【氏名】千嶋潤一

(72)【発明者】

【氏名】片▲瀬▼ 佑記

(72)【発明者】

【氏名】西山和輝

(72)【発明者】

【氏名】須賀勝彦

(72)【発明者】

【氏名】宮田恵里

(72)【発明者】

【氏名】武田浩一郎

【審査官】佐久聖子

(56)【参考文献】

【文献】特開平０５－３０７３９７（ＪＰ，Ａ）

【文献】特開２０１８－０２２３８９（ＪＰ，Ａ）

【文献】特開２００２－３２８７１６（ＪＰ，Ａ）

【文献】特開２００８－０６２７３３（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１３／００－１３／１０

Ｇ１０Ｌ１５／００－１７／２６

Ｇ１０Ｌ１９／００－９９／００

Ｇ０６Ｆ３／１６

(57)【特許請求の範囲】

【請求項1】

設備の点検に用いられる音声認識システムであって、
点検した結果を含む音声である第１音声を入力する音声入力手段と、
前記第１音声を認識する音声認識手段と、
前記第１音声を認識した認識結果、又は、点検内容を含む音声である第２音声を示す出力音声を出力する出力手段と、
前記第２音声を示す前記出力音声の出力を中断させる中断手段と、
前記中断手段による中断を解除する解除手段と、
を含み、
前記出力手段は、前記解除手段によって中断が解除されると、中断された第１時点で完了していた点検内容を示す音声を出力する
音声認識システム。

【請求項2】

前記第１時点で完了していた点検内容を示す前記音声を出力後、前記第１時点で中断された前記第２音声が開始される時点から、前記出力音声の出力を再開する
請求項１に記載の音声認識システム。

【請求項3】

前記第１音声に含まれるノイズをキャンセルした第３音声を生成する手段を含む
請求項１または２に記載の音声認識システム。

【請求項4】

設備の点検に用いられる音声認識装置であって、
点検した結果を含む音声である第１音声を入力する音声入力手段と、
前記第１音声を認識する音声認識手段と、
前記第１音声を認識した認識結果、又は、点検内容を含む音声である第２音声を示す出力音声を出力する出力手段と、
前記第２音声を示す前記出力音声の出力を中断させる中断手段と、
前記中断手段による中断を解除する解除手段と、
を含み、
前記出力手段は、前記解除手段によって中断が解除されると、中断された第１時点で完了していた点検内容を示す音声を出力する
音声認識装置。

【請求項5】

設備の点検に用いられる音声認識システムが行う音声認識方法であって、
音声認識システムが、点検した結果を含む音声である第１音声を入力する音声入力手順と、
音声認識システムが、前記第１音声を認識する音声認識手順と、
音声認識システムが、前記第１音声を認識した認識結果、又は、点検内容を含む音声である第２音声を示す出力音声を出力する出力手順と、
音声認識システムが、前記第２音声を示す前記出力音声の出力を中断させる中断手順と、
音声認識システムが、前記中断手順による中断を解除する解除手順と、
を含み、
前記出力手順は、前記解除手順によって中断が解除されると、中断された第１時点で完了していた点検内容を示す音声を出力する
音声認識方法。

【請求項6】

請求項５に記載の音声認識方法をコンピュータに実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラムに関する。

【背景技術】

【0002】

設備等を点検する上で、点検を行う者を支援する技術が知られている。

【0003】

例えば、タブレット端末、又は、ハンディーターミナル等によって、設備がバーコードで管理される。このようなバーコードを用いることで、機器の状況を素早く判断する。また、点検データが電子化されて集計及び管理されるため、点検のし忘れ、及び、点検の漏れといったヒューマンエラーを防止し、確実な点検の実施を支援する技術が知られている（例えば、非特許文献１等）。

【先行技術文献】

【非特許文献】

【0004】

【文献】"設備巡回点検システム"、［ｏｎｌｉｎｅ］、［令和２年３月１１日検索］、インターネット〈URL:http://www.tm-es.co.jp/service-product/services/products/mimawari-kun-mit.html〉

【発明の概要】

【発明が解決しようとする課題】

【0005】

従来の技術では、点検が行われている間に、他の作業が割り込んできた場合等があっても、点検を中断できない場合が多い。そのため、点検が行われている間に他の作業が割り込んでくると、点検を最初からやり直す等の手間が発生する場合がある。

【0006】

本発明は、上記課題に鑑みてなされたものであり、点検を中断できることを目的とする。

【課題を解決するための手段】

【0007】

本発明の各実施形態による音声認識システム等は、以下のような構成を含む。

【0008】

音声認識システム（例えば、音声認識システム１である。）は、
第１音声（例えば、第１音声ＳＤ１である。）を入力する音声入力手段と、
前記第１音声を認識する音声認識手段（例えば、辞書Ｄ２である。）と、
前記第１音声を認識した認識結果、又は、第２音声を示す出力音声を出力する出力手段（例えば、ステップＳ０２である。）と、
前記出力音声の出力を中断させる中断手段（例えば、中断操作Ｃ１である。）と
を含む。

【0009】

このような構成であると、点検を中断できる。

【0010】

また、音声認識システムは、設備の点検に用いられるのが望ましい（例えば、図６である）。

【0011】

このような構成であると、点検を効率良く行うことができる。

【0012】

また、音声認識システムは、
前記中断手段による中断を解除する解除手段（例えば、解除操作Ｃ２である。）を更に含み、
前記出力手段は、
前記解除手段によって中断が解除されると、中断された第１時点から前記出力音声の出力を再開する、又は、前記第１時点より前の第２時点から前記出力音声を出力するのが望ましい（例えば、図９である）。

【0013】

例えば、図１０に示すように、事前に設定される複数の点検項目に基づいて、点検が行われる。このような点検作業の流れの中では、例えば、電話が鳴る、又は、他の人から話しかけられるといった割込となる作業が発生する場合がある。このような割込があった場合に、ユーザ１３は、中断操作Ｃ１で点検を中断できるのが望ましい。このように、ユーザ１３は、中断操作Ｃ１で点検を中断できると、点検を中断させた上で、割り込んできた作業を行うことができる。そして、割り込んできた作業の完了後、解除操作Ｃ２によって、ユーザ１３は、点検を中断かつ再開できる。

【0014】

また、音声認識システムでは、
前記中断手段は、
前記出力音声の出力を中断させる中断操作が入力される、前記音声入力手段が前記第１音声を入力する、前記音声認識手段が所定の言葉を認識する、所定の動作が開始される、又は、これらの組み合わせが行われると、前記出力音声の出力を中断させるのが望ましい。

【0015】

このようなイヤホン１２で操作ができる、又は、携帯端末１１等による所定の動作の開始及び終了に連動すると、携帯端末１１を取り出す手間等を省ける。

【0016】

また、音声認識装置（例えば、携帯端末１１である。）は、
第１音声を入力する音声入力手段と、
前記第１音声を認識する音声認識手段と、
前記第１音声を認識した認識結果、又は、第２音声を示す出力音声を出力する出力手段と、
前記出力音声の出力を中断させる中断手段と
を含む。

【0017】

また、音声認識システムが行う音声認識方法（例えば、図８である。）であって、
音声認識システムが、第１音声を入力する音声入力手順と、
音声認識システムが、前記第１音声を認識する音声認識手順と、
音声認識システムが、前記第１音声を認識した認識結果、又は、第２音声を示す出力音声を出力する出力手順と、
音声認識システムが、前記出力音声の出力を中断させる中断手順と
を含む。

【0018】

また、音声認識方法をコンピュータに実行させるためのプログラムである（例えば、図８である）。

【発明の効果】

【0019】

本発明に係る各実施形態によれば、点検を中断できる。

【図面の簡単な説明】

【0020】

【図1】音声認識システム１のシステム構成例を示す図である。

【図2】情報処理装置のハードウェア構成例を示す図である。

【図3】第１実施形態における全体処理例を示す図である。

【図4】登録データベースＤ１の例を示す図である。

【図5】第１実施形態における処理結果の例を示す図である。

【図6】第１実施形態における携帯端末の画面表示例を示す図である。

【図7】第１実施形態における機能構成例を示す図である。

【図8】第２実施形態における全体処理例を示す図である。

【図9】第２実施形態における処理結果の例を示す図である。

【図10】第２実施形態における携帯端末の画面表示例を示す図である。

【図11】第２実施形態における機能構成例を示す図である。

【図12】グループ設定及び省略を行う変形例を示す図である。

【図13】グループ設定の例を示す図である。

【図14】第２入力データを前回結果とする例を示す図である。

【図15】許容範囲を設定する例を示す図である。

【図16】第２入力データを正常値又は正常範囲とする例を示す図である。

【図17】第１辞書Ｄ２１１及び第２辞書Ｄ２１２を用いる変形例を示す図である。

【図18】現場ごとにキャンセルの対象とする周波数帯域を設定する例を示す図である。

【図19】中断及び解除の第１変形例を示す図である。

【図20】中断及び解除の第２変形例を示す図である。

【図21】音声入力及び音声出力の変形例を示す図である。

【発明を実施するための形態】

【0021】

以下、発明を実施するための最適かつ最小限な形態について、図面を参照して説明する。なお、図面において、同一の符号を付す場合には、同様の構成であることを示し、重複する説明を省略する。また、図示する具体例は、例示であり、図示する以外の構成が更に含まれる構成であってもよい。

【0022】

＜第１実施形態＞
＜全体構成例＞
図１は、音声認識システム１のシステム構成例を示す図である。例えば、音声認識システム１は、サーバ１０、音声認識装置の例である携帯端末１１、及び、イヤホン１２を含む構成である。

【0023】

サーバ１０、携帯端末１１、及び、イヤホン１２は、ネットワークＮＷを介して接続する。

【0024】

図示するように、ユーザ１３は、イヤホン１２を装着して、設備の点検を行う。また、ユーザ１３は、携帯端末１１を持って設備の点検を行う。一方で、サーバ１０は、設備の点検が行われる現場とは異なる位置に設置される。したがって、設定値及びデータ等は、サーバ１０にあらかじめ入力され、点検を行う際に、携帯端末１１は、ネットワークＮＷを介して、設定値及びデータ等を取得する。

【0025】

点検の対象となる設備は、例えば、空調設備等である。したがって、点検の現場は、企業における機械室等である。そして、点検では、圧力計、電圧計、電流計、薬液残量計、温度計、及び、湿度計等の計測器が示す値が、ユーザ１３によって点検される。

【0026】

サーバ１０及び携帯端末１１は、情報処理装置である。例えば、情報処理装置は、以下のようなハードウェア構成の装置である。

【0027】

＜ハードウェア構成例＞
図２は、情報処理装置のハードウェア構成例を示す図である。例えば、サーバ１０等の情報処理装置は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、以下「ＣＰＵＨＷ１」という。）、記憶装置ＨＷ２、ネットワークインタフェースＨＷ３、入力装置ＨＷ４、出力装置ＨＷ５、及び、インタフェースＨＷ６を有するハードウェア構成である。

【0028】

ＣＰＵＨＷ１は、演算装置及び制御装置の例である。

【0029】

記憶装置ＨＷ２は、主記憶装置及び補助記憶装置等である。

【0030】

ネットワークインタフェースＨＷ３は、ネットワークを介して外部装置等とデータを送受信する通信装置である。

【0031】

入力装置ＨＷ４は、ユーザの操作を入力するための装置である。例えば、入力装置ＨＷ４は、マウス、及び、キーボード等である。

【0032】

出力装置ＨＷ５は、処理結果をユーザに出力するための装置である。例えば、出力装置ＨＷ５は、ディスプレイ等である。

【0033】

インタフェースＨＷ６は、周辺機器を接続するためのコネクタ等である。

【0034】

イヤホン１２は、音声を入力する入力装置である。そして、イヤホン１２を介して入力されるユーザ１３が発する音声は、携帯端末１１に入力されて、音声認識等の処理が行われる。また、イヤホン１２は、音声を出力する出力装置である。したがって、イヤホン１２は、ユーザ１３に対して、携帯端末１１による処理によって音声を出力する。

【0035】

以下、ユーザ１３がイヤホン１２で入力する音声を「第１音声ＳＤ１」という。一方で、イヤホン１２を介してユーザ１３に出力される音声を「第２音声ＳＤ２」という。

【0036】

＜全体処理例＞
図３は、第１実施形態における全体処理例を示す図である。以下、図示するように、全体処理を「事前処理」と「本処理」に分けて説明する。「事前処理」は、「本処理」より前に行われる、音声認識システム１を運用する準備となる処理である。したがって、「事前処理」と「本処理」は連続して行われなくともよく、「事前処理」が「本処理」が開始されるまでに完了していればよい。

【0037】

＜事前処理の例＞
「事前処理」では、以下のような処理が行われる。

【0038】

ステップＳ０１では、音声認識システム１は、例えば、点検項目、及び、第２音声ＳＤ２用のデータ等を登録して、登録データベースＤ１を構築する。すなわち、登録データベースＤ１は、点検において、第２音声ＳＤ２となって読み上げられる内容を示す。また、入力される音声のデータのうち、どのデータをどのタイミングで第２音声ＳＤ２として出力すればよいかといった点検項目との対応付けも、登録データベースＤ１上に登録される。例えば、このように登録手順が行われる。このようにして、「事前処理」では、音声認識システム１は、「本処理」で第２音声ＳＤ２を出力できるようにするためのデータの入力及び設定を行う。具体的には、登録データベースＤ１は、以下のように構築される。

【0039】

図４は、登録データベースＤ１の例を示す図である。図示するように、登録データベースＤ１は、「項目番号」及び「点検項目」で構成される。

【0040】

例えば、第２音声ＳＤ２で出力される内容は、「点検項目」に入力される内容である。具体的には、「点検項目」には、点検の対象となる設備を特定する設備の名称（例えば、「項目番号」が「１」の例では、「消火ポンプ」である。）等が入力される。したがって、第２音声によって設備の名称が読み上げられると、ユーザ１３は、第２音声ＳＤ２を聞いて、これから点検する対象となる設備を特定できる。

【0041】

さらに、「点検項目」には、図示するように、詳細な点検内容が入力される。具体的には、詳細な点検内容は、「項目番号」が「１」の例における「圧力値」である。このような詳細な点検内容が第２音声によって読み上げられると、ユーザ１３は、第２音声ＳＤ２を聞いて、圧力値を点検し、第１音声ＳＤ１で圧力値を入力する作業を行うことが分かる。

【0042】

また、ステップＳ０１では、音声認識システム１は、辞書Ｄ２を入力する。すなわち、「事前処理」では、音声認識システム１は、「本処理」において第１音声ＳＤ１で入力される音声を言葉として認識する、音声認識が可能となるようにするためのデータの入力及び設定を行う。

【0043】

＜本処理の例＞
「本処理」は、点検の開始に応じて開始される。

【0044】

ステップＳ０２では、音声認識システム１は、登録された第２音声ＳＤ２を出力する出力手順を行う。

【0045】

以下、ステップＳ０２が実行されている間、すなわち、第２音声ＳＤ２が出力されている間に第１音声ＳＤ１が入力されるとする。このような場合には、音声認識システム１は、ステップＳ０３に進む。

【0046】

ステップＳ０３では、音声認識システム１は、第１音声ＳＤ１を入力する音声入力手順を行う。すなわち、ステップＳ０３では、音声認識システム１は、ユーザ１３が音声を発したのを感知する。このように、第１音声ＳＤ１が入力されると、音声認識システム１は、ステップＳ０４に進む。

【0047】

ステップＳ０４では、音声認識システム１は、第２音声ＳＤ２の出力を制限する制限手順を行う。

【0048】

ステップＳ０５では、音声認識システム１は、第１音声ＳＤ１に基づいて音声認識を行う音声認識手順を行う。

【0049】

ステップＳ０６では、音声認識システム１は、第１音声ＳＤ１を音声認識した音声認識結果を第２音声ＳＤ２で出力する。

【0050】

例えば、以上のような全体処理が行われると、以下のような処理結果となる。

【0051】

図５は、第１実施形態における処理結果の例を示す図である。以下、制限を行わない「第１項目実行例」と制限を行う「第２項目実行例」を比較して説明する。

【0052】

「第１項目実行例」では、まず、音声認識システム１は、第２音声ＳＤ２によって第１１出力ＥＸ１１を出力する。この例では、第１１出力ＥＸ１１は、「消火ポンプ：圧力」というように、点検の対象となる設備の名称、及び、点検の内容を続けて示す音声である。

【0053】

第１１出力ＥＸ１１に対して、ユーザ１３は、第１１出力ＥＸ１１で示す設備を点検した結果を示す第１２出力ＥＸ１２を第１音声ＳＤ１で、音声認識システム１に入力する操作を行う。具体的には、この例では、ユーザ１３は、「消火ポンプ」の設備が有する圧力計が示す「圧力」の値である「１２．３」を読み上げる。この読み上げで発せられる音声が第１２出力ＥＸ１２となる。

【0054】

次に、この例では、音声認識システム１は、第１２出力ＥＸ１２を音声認識する。そして、第１３出力ＥＸ１３で、点検が完了した内容、かつ、音声認識結果を第２音声ＳＤ２によって出力する。図示するように、第１３出力ＥＸ１３で出力される内容のうち、前半は、第１１出力ＥＸ１１の復唱である。続いて、第１３出力ＥＸ１３では、後半で、音声認識結果、すなわち、第１２出力ＥＸ１２と同様の内容が続けて出力される。このように、制限をせず、かつ、音声認識が正しく行われた場合には、音声認識システム１は、点検項目等の出力、点検結果の入力、音声認識、及び、音声認識結果の出力という順で動作する。

【0055】

このような動作が可能な音声認識システム１に対して、「第２項目実行例」では、第２音声ＳＤ２が出力されている間に、ユーザ１３は、第１音声ＳＤ１を入力して、第２音声ＳＤ２の出力を制限する。

【0056】

図示する例では、制限の対象となる第２音声ＳＤ２を第２１出力ＥＸ２１とする例である（ステップＳ０２）。第２１出力ＥＸ２１は、第１１出力ＥＸ１１が示す点検項目の次になる点検項目である。そして、第２１出力ＥＸ２１は、制限されない場合には、「消火ポンプ：外観」という内容である。

【0057】

図示するように、「第２項目実行例」では、第２１出力ＥＸ２１が出力されている（ステップＳ０２）途中で、ユーザ１３は、第２１出力ＥＸ２１で示す設備を点検した結果を示す第２２出力ＥＸ２２を第１音声ＳＤ１で、音声認識システム１に入力する操作を行う（ステップＳ０３）。

【0058】

このように、第２１出力ＥＸ２１が出力されている間に、第２２出力ＥＸ２２が入力されると、音声認識システム１は、第２１出力ＥＸ２１の出力を制限する制限処理ＰＲ１を行う（ステップＳ０４）。例えば、制限処理ＰＲ１は、第２１出力ＥＸ２１の出力を停止させる処理である。

【0059】

また、ユーザ１３は、「消火ポンプ」の設備の外観をチェックした結果である「× 液漏れあり」を読み上げる（ステップＳ０３）。この読み上げで発せられる音声が第２２出力ＥＸ２２となる。

【0060】

次に、この例では、音声認識システム１は、第２２出力ＥＸ２２を音声認識する（ステップＳ０５）。そして、音声認識システム１は、第２３出力ＥＸ２３で、第１３出力ＥＸ１３と同様に、点検が完了した内容、かつ、音声認識結果を第２音声ＳＤ２によって出力する（ステップＳ０６）。図示するように、第２３出力ＥＸ２３で出力される内容のうち、前半は、第２１出力ＥＸ２１の復唱である。続いて、第２３出力ＥＸ２３では、後半で、音声認識結果、すなわち、第２２出力ＥＸ２２と同様の内容が続けて出力される。

【0061】

＜画面表示例＞
図６は、第１実施形態における携帯端末の画面表示例を示す図である。例えば、点検は、以下のような順序で行われる。ただし、図示するような画面表示、順序及び入力項目は必須ではない。

【0062】

図６（Ａ）は、「メインメニュー」を示す画面である。以下、図６（Ａ）に示す画面を第１１画面ＰＮ１１という。第１１画面ＰＮ１１で「点検フロー」が押されると、点検を行う準備を行う画面である図６（Ｂ）に画面が遷移する。

【0063】

図６（Ｂ）は、「点検フロー一覧」を選択する画面である。以下、図６（Ｂ）に示す画面を第１２画面ＰＮ１２という。第１２画面ＰＮ１２は、点検を行う対象となる設備を選ぶ画面である。次に、第１２画面ＰＮ１２で設備が選ばれると、点検を行うユーザ１３を指定する画面である図６（Ｃ）に画面が遷移する。

【0064】

図６（Ｃ）は、「作業者の選択」を行う画面である。以下、図６（Ｃ）に示す画面を第１３画面ＰＮ１３という。第１３画面ＰＮ１３は、これから点検を行う作業者となるユーザ１３を選ぶ画面である。次に、第１３画面ＰＮ１３でユーザ１３が選ばれると、点検が開始され、図６（Ｄ）に画面が遷移する。

【0065】

図６（Ｄ）は、第１番目の点検項目用画面である。以下、図６（Ｄ）に示す画面を第１４画面ＰＮ１４という。第１４画面ＰＮ１４は、「点検項目書」に、点検の対象となる設備の名称及び点検の進捗度を示す。また、第１４画面ＰＮ１４は、「点検項目」に、点検内容となる「缶内圧力」を示す。例えば、第１４画面ＰＮ１４の表示に応じて、同様の内容を示す第２音声ＳＤ２が出力される（ステップＳ０２）。次に、点検結果を示す第１音声ＳＤ１が入力されると（ステップＳ０３）、音声認識が行われて（ステップＳ０５）、図６（Ｅ）に画面が遷移する。

【0066】

図６（Ｅ）は、第１番目の点検結果を示す画面である。以下、図６（Ｅ）に示す画面を第１５画面ＰＮ１５という。第１５画面ＰＮ１５は、第１４画面ＰＮ１４と比較すると、認識結果に「０．６６」という数値が表示される点が異なる。この「０．６６」は、第１音声ＳＤ１を音声認識した結果である。このように、音声認識結果が画面に表示されると、ユーザ１３は、音声認識結果を確認しやすい。

【0067】

例えば、以上のように、第１番目の点検項目について点検が行われる。以下、２番目以降の点検項目も同様に処理が行われる。

【0068】

図６（Ｆ）は、第２番目の点検項目用画面である。以下、図６（Ｆ）に示す画面を第１６画面ＰＮ１６という。第１番目の点検項目が「缶内圧力」であったのに対して、第１６画面ＰＮ１６では、点検項目が「押込ファン電流値」となる。そして、第１６画面ＰＮ１６では、第１番目の点検項目と同様に、画面と同様の内容を示す第２音声ＳＤ２が出力される（ステップＳ０２）。次に、点検結果を示す第１音声ＳＤ１が入力されると（ステップＳ０３）、音声認識が行われて（ステップＳ０５）、図６（Ｇ）に画面が遷移する。

【0069】

図６（Ｇ）は、第２番目の点検結果を示す画面である。以下、図６（Ｇ）に示す画面を第１７画面ＰＮ１７という。第１７画面ＰＮ１７は、第１６画面ＰＮ１６と比較すると、認識結果に「４３」という数値が表示される点が異なる。この「４３」は、第１音声ＳＤ１を音声認識した結果である。

【0070】

例えば、第１４画面ＰＮ１４又は第１６画面ＰＮ１６において、画面と同様の内容を示す第２音声ＳＤ２が出力されている間に、第１音声ＳＤ１が入力されると、音声認識システム１は、第２音声ＳＤ２の出力が制限して（ステップＳ０４）、音声認識の開始、及び、次の画面に遷移する。

【0071】

＜機能構成例＞
図７は、第１実施形態における機能構成例を示す図である。例えば、音声認識システム１は、音声入力手段１Ｆ１１、音声認識手段１Ｆ１２、登録手段１Ｆ１３、出力手段１Ｆ１４、制限手段１Ｆ１５、入力データ生成手段１Ｆ１６、記憶手段１Ｆ１７、判断手段１Ｆ１８、ノイズキャンセル手段１Ｆ１９、グループ設定手段１Ｆ２０、及び、省略操作手段１Ｆ２１を含む機能構成である。

【0072】

音声入力手段１Ｆ１１及び出力手段１Ｆ１４は、例えば、イヤホン１２等で実現される。また、音声認識手段１Ｆ１２、登録手段１Ｆ１３、制限手段１Ｆ１５、入力データ生成手段１Ｆ１６、記憶手段１Ｆ１７、判断手段１Ｆ１８、ノイズキャンセル手段１Ｆ１９、グループ設定手段１Ｆ２０、及び、省略操作手段１Ｆ２１は、携帯端末１１又はサーバ１０が有するＣＰＵＨＷ１、記憶装置ＨＷ２、入力装置ＨＷ４、出力装置ＨＷ５、及び、インタフェースＨＷ６等の演算装置、記憶装置、入力装置、及び、出力装置等が協働して動作して実現する。

【0073】

特に、点検を行うユーザ１３が点検に慣れているような場合には、点検の内容及び順序といった詳細が第２音声ＳＤ２で案内されなくとも、熟知している場合がある。このような場合には、ユーザ１３は、第２音声ＳＤ２がすべて出力され終わる前に、点検結果を第１音声ＳＤ１で入力して、点検を早く終わらせたい場合がある。そこで、上記の例のように、第２音声ＳＤ２の出力をしている間に、第１音声ＳＤ１が入力されると、第２音声ＳＤ２の出力が制限されるのが望ましい。このように、第２音声ＳＤ２の出力を制限して、第１音声ＳＤ１が入力できるようになると、ユーザ１３は、第２音声ＳＤ２が出力され終わるのを待たずに済むため、音声の入力を行うための時間を短縮できる。

【0074】

＜第２実施形態＞
第２実施形態は、第１実施形態と同様のシステム構成である音声認識システム１で実現する。また、第２実施形態における携帯端末１１及びサーバ１０のハードウェア構成も第１実施形態と同様とする。第２実施形態は、第１実施形態と比較すると、全体処理が異なる。以下、異なる点を中心に説明し、重複する説明を省略する。

【0075】

＜全体処理例＞
図８は、第２実施形態における全体処理例を示す図である。第１実施形態と比較すると、第２実施形態は、ステップＳ２１乃至ステップＳ２３が行われる点が異なる。また、第２実施形態における「事前処理」は、第１実施形態と同様とする。

【0076】

ステップＳ０２では、音声認識システム１は、登録された第２音声ＳＤ２を出力する。

【0077】

以下、ステップＳ０２が実行されている間、すなわち、第２音声ＳＤ２が出力されている間に、中断操作Ｃ１が入力される例で説明する。このような場合には、音声認識システム１は、ステップＳ２１に進む。なお、中断操作Ｃ１がどのような操作かは、事前に設定される。

【0078】

ステップＳ２１では、音声認識システム１は、中断操作Ｃ１を入力する。このように、中断操作Ｃ１が入力されると、音声認識システム１は、第２音声ＳＤ２の出力を中断させる。

【0079】

また、音声認識システム１は、第２音声ＳＤ２の出力を中断している間に中断を解除する解除操作Ｃ２が入力されると、ステップＳ２２に進む。なお、解除操作Ｃ２がどのような操作かは、事前に設定される。

【0080】

ステップＳ２２では、音声認識システム１は、解除操作Ｃ２に基づいて、中断を解除する。

【0081】

ステップＳ２３では、音声認識システム１は、第２音声ＳＤ２の出力を再開する。

【0082】

例えば、以上のような全体処理が行われると、以下のような処理結果となる。

【0083】

図９は、第２実施形態における処理結果の例を示す図である。以下、第２実施形態における「第２項目実行例」の第２１出力ＥＸ２１を中断の対象とする例で説明する。

【0084】

例えば、第２１出力ＥＸ２１を示す出力音声が出力されている（ステップＳ０２）間に、中断操作Ｃ１が入力されるとする。そして、中断操作Ｃ１が入力されると、音声認識システム１は、中断処理ＰＲ２を行う（ステップＳ２１）。以下、中断操作Ｃ１を入力して、中断した時点を「第１時点」という。

【0085】

中断処理ＰＲ２は、図示するように、第２１出力ＥＸ２１の途中で出力を止める処理である。さらに、中断処理ＰＲ２は、中断した時点以降、解除操作Ｃ２が入力されるまで出力を行わないようにする処理である。

【0086】

次に、解除操作Ｃ２が入力されると、音声認識システム１は、中断を解除する（ステップＳ２２）。具体的には、解除操作Ｃ２が入力されると、音声認識システム１は、第２００出力ＥＸ２００を示す出力音声を出力し、第２１出力ＥＸ２１を示す出力音声の出力を再開する。

【0087】

第２００出力ＥＸ２００は、第１時点で完了していた点検の内容を示す出力音声である。このような出力音声によって、ユーザ１３に、どこまで点検が終わっていたかを思い出させる。

【0088】

そして、第２００出力ＥＸ２００が出力された後、第２１出力ＥＸ２１の出力が再開される（ステップＳ２３）。

【0089】

＜画面表示例＞
図１０は、第２実施形態における携帯端末の画面表示例を示す図である。例えば、点検は、以下のような順序で行われる。ただし、図示するような画面表示、順序及び入力項目は必須ではない。

【0090】

図１０（Ａ）は、第１番目の点検結果を示す画面である。以下、図１０（Ａ）に示す画面を第２１画面ＰＮ２１という。第２１画面ＰＮ２１は、第１番目に行う点検の内容が「蒸気温度」であって、点検結果として「１２０」が入力された場合に表示される画面の例である。図示するように、テキスト出力Ｂ２によって音声認識結果が出力される。そして、テキスト出力Ｂ２を見て音声認識結果が誤っている場合には、再入力ボタンＢ１を押して、再度、点検結果を入力できるのが望ましい。

【0091】

同様に、第２番目、第３番目、及び、第４番目の順序で点検が行われる。そして、この例では、図１０（Ｂ）に示す第２２画面ＰＮ２２が、第２番目の点検結果が入力された場合に表示される画面の例である。

【0092】

図１０（Ｃ）に示す第２３画面ＰＮ２３は、第３番目の点検結果が入力された場合に表示される画面の例である。そして、図１０（Ｄ）に示す第２４画面ＰＮ２４は、第４番目の点検結果が入力された場合に表示される画面の例である。

【0093】

＜機能構成例＞
図１１は、第２実施形態における機能構成例を示す図である。例えば、音声認識システム１は、音声入力手段１Ｆ１１、音声認識手段１Ｆ１２、出力手段１Ｆ１４、解除手段１Ｆ１０１、及び、中断手段１Ｆ１００を含む機能構成である。

【0094】

音声入力手段１Ｆ１１及び出力手段１Ｆ１４は、例えば、イヤホン１２等で実現される。また、音声認識手段１Ｆ１２、解除手段１Ｆ１０１、及び、中断手段１Ｆ１００は、携帯端末１１又はサーバ１０が有するＣＰＵＨＷ１、記憶装置ＨＷ２、入力装置ＨＷ４、出力装置ＨＷ５、及び、インタフェースＨＷ６等の演算装置、記憶装置、入力装置、及び、出力装置等が協働して動作して実現する。

【0095】

【0096】

＜変形例＞
なお、点検項目は、数値、又は、「〇」若しくは「×」（「ＹＥＳ」若しくは「ＮＯ」等でもよい。）の形式で入力及びチェックされる「定式」と、「漏れあり」等のようにユーザ１３がコメントで入力する「非定式」があってもよい。また、点検結果は、ユーザ１３が撮影した画像等が添付できてもよい。

【0097】

なお、音声認識システム１は、設備の点検以外に用いられてもよい。すなわち、点検の対象となる対象物は、設備以外の装置でもよい。また、音声認識システム１は、点検以外に用いられてもよい。

【0098】

音声認識システム１が設備の点検に用いられると、設備の点検を行う作業時間を短縮させて、作業の省力化ができる。

【0099】

なお、音声認識システム１は、空調設備機器の機械室における点検で用いられるのが望ましい。空調設備機器の機械室における点検では、点検箇所が機械室内で点在する場合が多い。また、多数の大型機器が設置されている場合には、個々の大型機器について、点検の対象となるメータ類も点在する場合が多い。このような機械室では、点検項目も多岐にわたる場合が多い。そして、このような多数の点検を行う場合には、ユーザは、点検をするために多く移動する。また、場合によっては、ユーザは、移動において梯子を登る等の移動もあり得る。

【0100】

さらに、ユーザは、点検では、照明を点灯させる（そして、終了後は消灯させる。）、又は、動力盤の扉を開ける等の付随的な作業も行う。そのため、点検結果の入力等をできるだけ手作業で入力するのをなくしたい事情がある。そこで、音声認識システム１によって、音声で点検結果等を入力できると、ユーザは点検を行いやすい。

【0101】

また、上記のような機械室での点検のように、移動が多い場合には、他の作業者及び管理者等から点検を行っている間に声を掛けられる可能性も高くなる。そのため、音声認識システム１で中断及び解除ができると、点検を中断し、再開できるため、点検を効率良く行うことができる。

【0102】

また、設備及びメータ類等の配置によっては、１か所に複数の計器類が設置される場合もある。このような設置状況下では、１か所で多くの点検結果を入力する場合も多い。そのため、装置による音声の出力が終わるまで待ってから音声入力を行うと、音声の入力を行うための待ち時間が長くなるので点検に時間がかかる。一方で、装置による音声の出力を制限して、音声が入力できる構成であると、ユーザは、音声が出力され終わるのを待たずに済むため、音声の入力を行うための時間を短縮できる。ゆえに、点検を効率良く行うことができる。音声を出力するのに用いられるイヤホン１２は、内耳式であるのが望ましい。内耳式は、イヤホン１２を装着した際に、外部からの音を遮音する形状である。例えば、設備が稼働中の現場では、設備が稼働する音等によるノイズが多い環境で場合が多い。そのため、内耳式のイヤホン１２であると、ノイズが多い環境であっても、出力される音声が聞き取りやすい。また、骨伝導方式のイヤホンと比較すると、内耳式である方が小型化できる場合が多い。

【0103】

点検項目に対して、順序、及び、点検の要否等が設定できてもよい。例えば、第２音声ＳＤ２は、登録データベースＤ１における「項目番号」の順に出力を行う。そこで、点検を行う前に、「事前処理」において、「項目番号」の設定、又は、「点検項目」と「項目番号」の対応付けを変更して、点検が行われる順序を変更できてもよい。

【0104】

また、点検を行わない「点検項目」を「ＯＦＦ」にするような設定ができてもよい。

【0105】

点検する項目は、設備の稼働状況等によって異なる場合がある。したがって、順序及び点検の要否が設定できると、点検を行う日の稼働状況等に揃えて柔軟に点検する内容を変更できる。

【0106】

情報処理装置は、上記に示すハードウェア構成に限られない。例えば、情報処理装置は、上記に示す以外の演算装置、制御装置、記憶装置、入力装置、出力装置、及び、周辺機器を更に有するハードウェア構成でもよい。また、入力装置及び出力装置が一体となってタッチパネル等でもよい。なお、携帯端末１１及びサーバ１０は、異なるハードウェア構成の装置でもよい。さらに、周辺機器及び他の装置との接続は、有線でもよいし、無線でもよい。

【0107】

また、携帯端末１１は、タブレット、スマートフォン、又は、モバイルパソコン等の情報処理装置でもよい。

【0108】

＜制限処理の変形例＞
なお、制限処理ＰＲ１は、第２音声ＳＤ２の出力を停止する処理に限られない。例えば、制限処理ＰＲ１は、第２音声ＳＤ２の音量を小さくして第２音声ＳＤ２を制限する処理でもよい。また、制限処理ＰＲ１は、第２音声ＳＤ２の音量を徐々に小さくして第２音声ＳＤ２を制限する処理でもよい。このように、制限処理ＰＲ１は、通常よりも音量を絞って第２音声ＳＤ２の出力を制限してもよい。

【0109】

又は、制限処理ＰＲ１は、第２音声ＳＤ２の次に出力させる音声の出力を開始する第２音声ＳＤ２を制限する処理でもよい。このように、制限処理ＰＲ１は、現在、第２音声ＳＤ２で示している点検項目から次の点検項目に進むようにして、第２音声ＳＤ２の出力を制限してもよい。

【0110】

ほかにも、制限処理ＰＲ１は、第２音声ＳＤ２の出力速度を速くして第２音声ＳＤ２を制限する処理でもよい。すなわち、制限処理ＰＲ１は、第２音声ＳＤ２を早送り再生して、第２音声ＳＤ２の出力を制限してもよい。

【0111】

このような制限処理ＰＲ１が行われると、不要な音声の出力を少なくできる。

【0112】

＜グループ設定及び省略を行う変形例＞
なお、点検は、一部が省略できてもよい。例えば、省略は、以下のような処理である。

【0113】

図１２は、グループ設定及び省略を行う変形例を示す図である。以下、点検の対象となる設備が「第１設備」、「第２設備」、「第３設備」、及び、「第４設備」であり、この順序で点検を行う例で説明する。

【0114】

この例では、第１実施形態等と同様に、第１設備についての点検項目が、第３１出力ＥＸ３１で出力されるとする。また、この例では、第３１出力ＥＸ３１を含む第１設備についての点検が省略の対象であるとする。

【0115】

省略を行う場合には、ユーザ１３は、省略操作Ｃ３を行う。例えば、省略操作Ｃ３は、所定のボタンを押す、又は、「省略」等のように事前に設定される言葉を第１音声ＳＤ１で入力する等の操作である。なお、省略操作Ｃ３がどのような操作かは事前に設定される。

【0116】

図示するように、第３１出力ＥＸ３１が出力されている間に、省略操作Ｃ３が行われると、音声認識システム１は、第３１出力ＥＸ３１を含む第１設備の点検を省略する省略処理ＰＲ３を行う。例えば、省略処理ＰＲ３は、第３１出力ＥＸ３１の出力を中止して、第２設備の点検に進む処理である。したがって、省略操作Ｃ３が行われると、音声認識システム１は、第２設備についての点検項目を示す第３２出力ＥＸ３２の出力を開始する。

【0117】

なお、事前に登録される点検項目のうち、どの点検項目が第１設備の点検に対応するかは、例えば、以下のようなグループ設定に基づいて把握される。

【0118】

図１３は、グループ設定の例を示す図である。例えば、図示するような点検項目が事前に登録された場合を例に説明する。この例では、「項目番号」が「１」及び「２」の「点検項目」が第１設備についての点検である。同様に、「項目番号」が「３」乃至「５」の「点検項目」が第２設備についての点検である。さらに、「項目番号」が「６」の「点検項目」が第３設備についての点検である。さらにまた、「項目番号」が「７」の「点検項目」が第４設備についての点検である。

【0119】

これらの複数の点検項目に対して、グループＧＳが設定される。例えば、グループＧＳは、図示するように、音声認識システム１は、「グループ」に数値を入力して設定するグループ設定手順を行う。この例では、「項目番号」が「１」及び「２」の「点検項目」をまとめて「Ｇ１」というグループに設定した例である。同様に、この例では、「項目番号」が「３」乃至「５」の「点検項目」をまとめて「Ｇ２」というグループに設定した例である。なお、グループＧＳは、設備ごとに限られず、「Ｇ３」のように、第３設備及び第４設備の点検項目をまとめて１つのグループに設定してもよい。

【0120】

図１２に示すように、例えば、第１設備についての点検に対応する第３１出力ＥＸ３１に対して省略操作Ｃ３がされた場合には、音声認識システム１は、省略操作Ｃ３が「Ｇ１」というグループに対応する操作であると判断する。

【0121】

図１３に示すように、「Ｇ１」のグループＧＳには、「項目番号」が「１」及び「２」の「点検項目」が属する。ゆえに、音声認識システム１は、「項目番号」が「１」及び「２」の「点検項目」を示す第２音声ＳＤ２を省略する省略手順を行う。

【0122】

なお、省略操作Ｃ３は、省略するグループ又は設備の名称を入力する操作でもよい。

【0123】

設備は、例えば、稼働していない場合には、点検を行わなくともよい場合がある。そのような設備に対する点検を省略できると、点検を効率良く行うことができる。

【0124】

＜チェックを行う変形例＞
音声認識システム１は、点検結果をチェックして設備に異常があるか否かを判断する構成が望ましい。以下、チェックの対象となる値、すなわち、第１音声ＳＤ１で入力される内容であって音声認識された結果を示すデータを「第１入力データ」という。一方で、第１データをチェックするのに用いられるデータを「第２入力データ」という。

【0125】

音声認識システム１は、第１入力データが第１データ生成手順、すなわち、音声認識によって生成されると、第１入力データと第２入力データを比較して異常であるか否かを判断する判断手順を行う。

【0126】

第２入力データは、第１入力データより前、すなわち、第１入力データをチェックするまでに記憶手順によって記憶されていればよい。例えば、第２入力データは、以下のように記憶される。

【0127】

図１４は、第２入力データを前回結果とする例を示す図である。以下、第１実施形態と同様の点検項目である場合を例に説明する。例えば、第２入力データは、図示する「第２入力データ」のように、それぞれの「点検項目」に対応して記憶される前回の点検結果（以下「前回結果Ｖ２１」という。）である。

【0128】

なお、前回結果Ｖ２１は、前回の点検で異常がなかったのを前提とする。したがって、前回の点検で異常があった場合には、それ以前の点検結果又は正常値が前回結果Ｖ２１に入力されてもよい。

【0129】

つまり、音声認識システム１は、第１入力データ、すなわち、今回の点検結果を前回結果Ｖ２１と比較して違いがあるか否かを判断する。そして、音声認識システム１は、第１入力データと第２入力データが異なると、異常であると判断する。

【0130】

なお、正常と判断する範囲には、ある程度の許容範囲があってもよい。すなわち、音声認識システム１は、第１入力データが第２入力データに対して許容範囲外であると、異常であると判断する。例えば、許容範囲は、以下のように設定される。

【0131】

図１５は、許容範囲を設定する例を示す図である。例えば、許容範囲Ｖ２２は、図示する「許容範囲」のように、前回結果Ｖ２１から結果が外れても「正常」と判断する範囲を示す。なお、この例は、「項目番号」が「２」の場合のように、前回結果Ｖ２１と一致しない場合をすべて「異常」と判断させるために、許容範囲Ｖ２２に「なし」と設定する例である。

【0132】

このように、許容範囲Ｖ２２によって、前回結果Ｖ２１に対して幅を持たせる構成であってもよい。特に、数値が点検の対象となる場合には、数値の微小な変動が異常でない場合が多い。したがって、このように許容できる範囲が設定できると、異常を精度良く判断できる。

【0133】

このように、前回結果Ｖ２１、すなわち、直近の点検結果と比較して、違いがあるような場合には、設備に異常があると判断される。このようなチェックが行われると、音声認識システム１は、異常が発生しているような設備を知らせることができる。

【0134】

なお、チェックは、以下のように第２入力データに正常値又は正常範囲を示す値を設定して行われてもよい。

【0135】

図１６は、第２入力データを正常値又は正常範囲とする例を示す図である。例えば、図示する「第２入力データ正常値又は正常範囲」のような値（以下「正常値Ｖ２３」という。）が事前に設定されてもよい。

【0136】

正常値Ｖ２３が設定されると、音声認識システム１は、正常とする値又は範囲を把握できる。したがって、音声認識システム１は、第１入力データを正常値Ｖ２３と比較して、第１入力データと第２入力データが異なる、又は、第１入力データが正常範囲の範囲外であると、異常であると判断する。このようなチェックが行われると、音声認識システム１は、異常が発生しているような設備を知らせることができる。

【0137】

＜第１辞書及び第２辞書を用いる変形例＞
なお、携帯端末１１にデータ及びプログラム等がダウンロードされて、携帯端末１１で全体処理が行われてもよい。例えば、点検を行う現場は、通信環境が良くない場合がある。すなわち、現場は、携帯端末１１とサーバ１０の間で通信を行うのが難しい通信環境である場合がある。

【0138】

そこで、点検を開始する前に、サーバ１０から事前に入力される設定値等がダウンロードされて、点検を行っている間は、携帯端末１１とサーバ１０の間で通信が行われなくとも全体処理が完了できる構成であってもよい。なお、この場合には、点検が完了し、携帯端末１１とサーバ１０の間で通信が行える環境となった場合に、携帯端末１１からサーバ１０へ点検結果等をアップロードしてもよい。

【0139】

このような場合等において、音声認識を行うために用いる辞書が、以下のように点検の分野用の辞書であるのが望ましい。

【0140】

図１７は、第１辞書Ｄ２１１及び第２辞書Ｄ２１２を用いる変形例を示す図である。以下、サーバ１０のようにネットワークＮＷを介して利用できる情報処理装置を「第１情報処理装置」という。第１情報処理装置に対して、現場でユーザ１３が利用できる携帯端末１１のような情報処理装置を「第２情報処理装置」という。

【0141】

図示するように、第１情報処理装置で音声認識に用いられる辞書を「第１辞書Ｄ２１１」という。一方で、第２情報処理装置で音声認識に用いられる辞書を「第２辞書Ｄ２１２」という。

【0142】

第２情報処理装置は、携帯する情報処理装置であるため、記憶領域ＭＥＭが第１情報処理装置と比較すると小さくなりやすい。

【0143】

第２辞書Ｄ２１２は、点検の分野用の辞書である。したがって、第１辞書Ｄ２１１より、第２辞書Ｄ２１２は、データの容量を小さくできる。そのため、第２辞書Ｄ２１２は、第２情報処理装置のように、第１情報処理装置と比較して、記憶装置の記憶できる容量が小さい記憶領域ＭＥＭの情報処理装置であっても、記憶できる辞書が用いられるのが望ましい。

【0144】

点検の分野用の辞書は、点検に良く用いられる用語を音声認識するのに適する辞書である。例えば、点検の分野用の辞書は、数値、点検結果に用いられる用語及び設備の名称等が設定される。このように、点検において使用頻度が高い用語に絞った辞書が用いられると、音声認識を小さい記憶領域で実現でき、かつ、精度良く音声認識を実行して第１入力データＶ１０を生成できる。

【0145】

＜ノイズキャンセルの変形例＞
音声認識システム１は、第１音声ＳＤ１に含まれるノイズをキャンセルする構成が望ましい。そして、第１音声ＳＤ１ノイズをキャンセルした音声（以下「第３音声」という。）に基づいて、音声認識が行われるのが望ましい。

【0146】

ノイズのキャンセルは、例えば、ローパスフィルタ、及び、バンドパスフィルタ等のフィルタ又は複数のフィルタの組み合わせによって、対象する周波数帯域に含まれるノイズを減衰するようにして行われる。例えば、フィルタは、デジタルフィルタ、又は、フィルタリングを行う回路等によって実現する。

【0147】

また、キャンセルの対象となる周波数帯域は、現場又は位置ごとに個別に設定されるのが望ましい。以下、現場ごとに、キャンセルの対象とする周波数帯域を設定する場合の例を説明する。

【0148】

図１８は、現場ごとにキャンセルの対象とする周波数帯域を設定する例を示す図である。以下、図１８（Ａ）を「第１現場」用とし、図１８（Ｂ）を「第２現場」用とする。なお、キャンセルの対象とする周波数帯域は、ＧＰＳ等を用いて位置情報に基づいて設定されてもよい。

【0149】

例えば、第１現場において、一定時間の音声（ユーザ１３が発する音声はない状態であるとする。）を入力し、音声を入力したデータに対して周波数解析（例えば、ＦＦＴ（高速フーリエ変換、ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）等である。）を行うと、図１８（Ａ）及び図１８（Ｂ）のような周波数解析結果が得られる。

【0150】

図１８（Ａ）は、第１現場で、図１８（Ａ）に示すような周波数帯域（以下「第１周波数帯域ＦＲ１」という。）に、ノイズ（以下、第１現場で発生するノイズを「第１ノイズＮＺ１」という。）が発生する例である。

【0151】

図１８（Ｂ）は、第２現場で、図１８（Ｂ）に示すような周波数帯域（以下「第２周波数帯域ＦＲ２」という。）に、ノイズ（以下、第２現場で発生する２つのノイズを「第２ノイズＮＺ２」及び「第３ノイズＮＺ３」という。）が発生する例である。

【0152】

ノイズは、現場又は位置ごとに異なる場合がある。例えば、現場ごとに、稼働している設備の種類が異なると、設備は、異なる音を発する場合があるため、ノイズの発生する周波数帯域も異なるようになる場合がある。この例では、第１現場は、第１ノイズＮＺ１が発生するのに対して、第２現場は、第２ノイズＮＺ２及び第３ノイズＮＺ３が発生する。この例では、第１現場は、第２現場よりも低い周波数帯域でノイズが発生する。

【0153】

そのため、第１現場では、第１ノイズＮＺ１を減衰させるため、第１周波数帯域ＦＲ１がキャンセルの対象となるのが望ましい。一方で、第２現場では、第２ノイズＮＺ２及び第３ノイズＮＺ３を減衰させるため、第２周波数帯域ＦＲ２がキャンセルの対象となるのが望ましい。

【0154】

第１周波数帯域ＦＲ１及び第２周波数帯域ＦＲ２は、例えば、点検を行う前に現場又は位置ごとに音声を解析して設定される。なお、周波数帯域の設定は、数値で入力できてもよい。

【0155】

このようにすると、それぞれの現場又は位置に適したノイズのキャンセルができる。そのため、音声に含まれるノイズを減衰させた第３音声で音声認識ができるため、音声認識の精度を向上させることができる。

【0156】

＜中断及び解除の変形例＞
中断処理ＰＲ２は、以下のように、音声認識システム１が、音声認識によって所定の言葉を認識する場合に行われてもよい。

【0157】

図１９は、中断及び解除の第１変形例を示す図である。以下、第２実施形態と同様の第２音声ＳＤ２を出力する場合を例に説明する。第２実施形態と比較すると、この変形例は、中断及び解除に所定の言葉を用いる点が異なる。

【0158】

この例では、音声認識システム１は、第１音声ＳＤ１で「ポーズ」という言葉（以下「中断音声Ｃ１１」という。）を入力すると、第２音声ＳＤ２の出力を中断する。

【0159】

そして、中断の後、音声認識システム１は、第１音声ＳＤ１で「解除」という言葉（以下「解除音声Ｃ２１」という。）を入力すると、中断を解除する。

【0160】

なお、中断音声Ｃ１１及び解除音声Ｃ２１がどのような言葉かは、事前に設定される。

【0161】

このように、所定の言葉で中断及び解除が操作できると、ユーザ１３は、例えば、手に道具を持つような場合等でも操作を行うことができ、操作性を向上できる。

【0162】

図２０は、中断及び解除の第２変形例を示す図である。この例は、図示するように、イヤホン１２が有するボタンを押す操作が中断操作となる例である。

【0163】

例えば、１回目のボタンを押す操作（以下「第１操作Ｃ１２」という。）によって、音声認識システム１は、第２音声ＳＤ２の出力を中断する。

【0164】

次に、２回目のボタンを押す操作（以下「第２操作Ｃ２２」という。）によって、音声認識システム１は、中断を解除する。

【0165】

このようなイヤホン１２で操作ができると、携帯端末１１を取り出す手間等を省ける。

【0166】

なお、図示するように、第２００出力ＥＸ２００が省略されてもよい。この例では、音声認識システム１は、中断が行われた第１時点より、前の時点である第２１出力ＥＸ２１が開始される時点（以下「第２時点」という。）から出力音声を出力する。なお、第２時点は、事前に設定される、又は、第１時点で出力されていた出力音声の最初の時点等である。このように、出力音声が言い直しされる構成でもよい。

【0167】

また、中断及び解除は、例えば、所定のボタンを押している間、中断し、ボタンが押されるのが終わると解除するといったように、ボタン等で実現してもよい。

【0168】

他にも、中断及び解除は、携帯端末１１等による所定の動作の開始及び終了に連動してもよい。例えば、携帯端末１１に電話がかかってきたのを感知すると、音声認識システム１は、第２音声ＳＤ２の出力を中断する。なお、所定の動作は、事前に設定される。また、所定の動作は、外部装置による動作であってもよい。

【0169】

＜音声入力及び音声出力の変形例＞
図２１は、音声入力及び音声出力の変形例を示す図である。以下、図示するように音声で「１２．３」という数値（以下「対象数値２０」という。）を扱う場合を例に説明する。

【0170】

第１音声ＳＤ１、すなわち、入力では、対象数値２０は、１桁ずつ入力されるのが望ましい。具体的には、図示するように、第１音声ＳＤ１となる発音２１は、対象数値２０を分解して、「いち」、「に」、「てん」、及び、「さん」というように、１桁ずつ読み上げられるのが望ましい。

【0171】

第２音声ＳＤ２、すなわち、出力では、対象数値２０は、数値全体を表現するように出力されるのが望ましい。具体的には、図示するように、第２音声ＳＤ２となるデータ音声２２は、対象数値２０の全体を表現して「じゅうにてんさん」というように、数値全体が表現されるように出力されるのが望ましい。

【0172】

発音２１のように、１桁ずつ読み上げられる音声であると、音声認識を精度良く行うことができる。一方で、データ音声２２が、数値全体を表現すると、ユーザ１３は、１桁ずつ出力されるより、数値を音声で理解しやすい。

【0173】

＜オフラインで音声認識を行う変形例＞
オフラインの環境であっても、入力された音声を音声認識できる構成が望ましい。

【0174】

建築・保守現場は、通信環境によってインターネットにつながりにくい環境である場合も多い。そのため、常時クラウドを用いるのが困難な場合も多い。ゆえに、常時、クラウドにある音声認識エンジンを用いる構成であると、作業現場で音声認識等が実行できない場合がある。このような事態を避けるため、携帯端末１１内で動作する音声認識エンジンを用いる構成が望ましい。特に、定型であって、短い言葉は、携帯端末１１内で動作する音声認識エンジンで音声認識される構成が望ましい。

【0175】

このような構成であると、オフラインでも音声認識システム１を用いることができる。ゆえに、インターネットにつながりにくい環境であっても、音声認識システム１を用いて音声を入力することができる。

【0176】

さらに、ユーザ１３によるコメント等といった非定型な音声入力は、携帯端末１１が録音する構成であるのが望ましい。そして、事務所等といったインターネットにつながる環境下において、携帯端末１１は、録音済みの音声をクラウド上の音声認識エンジンに送信してテキスト化する構成が望ましい。

【0177】

このように、オフラインで使用できる音声認識エンジンと、オンラインで使用できる音声認識エンジンを使い分ける構成が望ましい。

【0178】

また、音声認識エンジンの使い分けは、通信環境を考慮して切り替えられてもよい。具体的には、携帯端末１１は、電波強度を計測して通信環境の良し悪しを判断する。なお、通信環境良し悪しは、現場ごとにあらかじめ登録又は以前の判断結果等が記憶されてもよい。このように、通信環境を考慮する構成であると、クラウド上の音声認識エンジンが使用できないといったトラブルを防ぐことができる。

【0179】

また、上記のようにオフライン等で録音を行うため、携帯端末１１は、入力した音声データを録音し、録音データを生成及び録音データを記憶できる記憶部及び録音データ生成部を有する構成であるのが望ましい。

【0180】

なお、記憶部及び録音データ生成部は、オフラインに用いられるに限られない。すなわち、記憶部及び録音データ生成部は、クラウド上の音声認識エンジンが使用できる環境であっても、録音データを生成及び録音データを記憶してもよい。

【0181】

通信は、突然切断される場合もあるため、クラウド上の音声認識エンジンが使用できる場合であっても、録音できる構成が望ましい。このような構成であると、バックアップを行うことができる。

【0182】

＜その他の実施形態＞
実施形態は、上記の例に限られない。例えば、装置の数は、上記の例に示す台数に限られない。したがって、上記の例における各装置は、２台以上のシステムであってもよい。一方で、装置は、１台の構成でもよい。また、情報処理装置の種類及び組み合わせも、上記に示す装置でなくともよい。

【0183】

実施形態は、上記の処理に限られない。例えば、本発明に係る音声認識方法は、上記に説明した以外の順序で行われてもよい。また、音声認識方法は、複数の情報処理装置で実行されてもよい。つまり、音声認識方法における各ステップは、冗長、分散、並列、仮想化又はこれらの組み合わせで実行されてもよい。

【0184】

実施形態は、プログラムによって実現されてもよい。すなわち、情報処理装置等のコンピュータは、プログラムに基づいて、演算装置及び記憶装置等を制御して、上記の方法を実行してもよい。また、プログラムは、コンピュータが読み取り可能な記録媒体に記録されて頒布することができる。なお、記録媒体は、磁気テープ、フラッシュメモリ、光ディスク、光磁気ディスク又は磁気ディスク等のメディアである。さらに、プログラムは、電気通信回線を通じて頒布することができる。

【0185】

なお、上記に示す実施形態の構成等に、その他の要素との組み合わせ等、上記の構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。

【符号の説明】

【0186】

１音声認識システム
１Ｆ１００中断手段
１Ｆ１０１解除手段
１Ｆ１１音声入力手段
１Ｆ１２音声認識手段
１Ｆ１３登録手段
１Ｆ１４出力手段
１Ｆ１５制限手段
１Ｆ１６入力データ生成手段
１Ｆ１７記憶手段
１Ｆ１８判断手段
１Ｆ１９ノイズキャンセル手段
１Ｆ２０グループ設定手段
１Ｆ２１省略操作手段
１０サーバ
１１携帯端末
１２イヤホン
１３ユーザ
２０対象数値
２１発音
２２データ音声
Ｃ１中断操作
Ｃ２解除操作
Ｃ３省略操作
Ｃ１１中断音声
Ｃ１２第１操作
Ｃ２１解除音声
Ｃ２２第２操作
Ｄ２１１第１辞書
Ｄ２１２第２辞書
ＥＸ１１第１１出力
ＥＸ１２第１２出力
ＥＸ１３第１３出力
ＥＸ２１第２１出力
ＥＸ２２第２２出力
ＥＸ２３第２３出力
ＥＸ３１第３１出力
ＥＸ３２第３２出力
ＥＸ２００第２００出力
ＦＲ１第１周波数帯域
ＦＲ２第２周波数帯域
ＧＳグループ
ＭＥＭ記憶領域
ＮＷネットワーク
ＮＺ１第１ノイズ
ＮＺ２第２ノイズ
ＮＺ３第３ノイズ
ＰＲ１制限処理
ＰＲ２中断処理
ＰＲ３省略処理
ＳＤ１第１音声
ＳＤ２第２音声
Ｖ１０第１入力データ
Ｖ２１前回結果
Ｖ２２許容範囲
Ｖ２３正常値

【図1】