IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ネインの特許一覧 ▶ 高砂熱学工業株式会社の特許一覧

特許7610803設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム
<>
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図1
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図2
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図3
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図4
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図5
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図6
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図7
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図8
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図9
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図10
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図11
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図12
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図13
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図14
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図15
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図16
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図17
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図18
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図19
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図20
  • 特許-設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム 図21
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-25
(45)【発行日】2025-01-09
(54)【発明の名称】設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラム
(51)【国際特許分類】
   G10L 15/22 20060101AFI20241226BHJP
   G10L 13/00 20060101ALI20241226BHJP
   G10L 13/02 20130101ALI20241226BHJP
   G10L 15/00 20130101ALI20241226BHJP
   G06F 3/16 20060101ALI20241226BHJP
【FI】
G10L15/22 200H
G10L13/00 100L
G10L13/02 130Z
G10L15/00 200L
G06F3/16 650
G06F3/16 670
【請求項の数】 6
(21)【出願番号】P 2020076810
(22)【出願日】2020-04-23
(65)【公開番号】P2021173842
(43)【公開日】2021-11-01
【審査請求日】2023-03-20
(73)【特許権者】
【識別番号】515048065
【氏名又は名称】株式会社ネイン
(73)【特許権者】
【識別番号】000169499
【氏名又は名称】高砂熱学工業株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】山本 健太郎
(72)【発明者】
【氏名】千嶋 潤一
(72)【発明者】
【氏名】片▲瀬▼ 佑記
(72)【発明者】
【氏名】西山 和輝
(72)【発明者】
【氏名】須賀 勝彦
(72)【発明者】
【氏名】宮田 恵里
(72)【発明者】
【氏名】武田 浩一郎
【審査官】佐久 聖子
(56)【参考文献】
【文献】特開平05-307397(JP,A)
【文献】特開2018-022389(JP,A)
【文献】特開2002-328716(JP,A)
【文献】特開2008-062733(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10
G10L 15/00-17/26
G10L 19/00-99/00
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
設備の点検に用いられる音声認識システムであって、
点検した結果を含む音声である第1音声を入力する音声入力手段と、
前記第1音声を認識する音声認識手段と、
前記第1音声を認識した認識結果、又は、点検内容を含む音声である第2音声を示す出力音声を出力する出力手段と、
前記第2音声を示す前記出力音声の出力を中断させる中断手段と、
前記中断手段による中断を解除する解除手段と、
を含み、
前記出力手段は、前記解除手段によって中断が解除されると、中断された第1時点で完了していた点検内容を示す音声を出力する
音声認識システム。
【請求項2】
前記第1時点で完了していた点検内容を示す前記音声を出力後、前記第1時点で中断された前記第2音声が開始される時点から、前記出力音声の出力を再開する
請求項に記載の音声認識システム。
【請求項3】
前記第1音声に含まれるノイズをキャンセルした第3音声を生成する手段を含む
請求項1または2に記載の音声認識システム。
【請求項4】
設備の点検に用いられる音声認識装置であって、
点検した結果を含む音声である第1音声を入力する音声入力手段と、
前記第1音声を認識する音声認識手段と、
前記第1音声を認識した認識結果、又は、点検内容を含む音声である第2音声を示す出力音声を出力する出力手段と、
前記第2音声を示す前記出力音声の出力を中断させる中断手段と、
前記中断手段による中断を解除する解除手段と、
を含み、
前記出力手段は、前記解除手段によって中断が解除されると、中断された第1時点で完了していた点検内容を示す音声を出力する
音声認識装置。
【請求項5】
設備の点検に用いられる音声認識システムが行う音声認識方法であって、
音声認識システムが、点検した結果を含む音声である第1音声を入力する音声入力手順と、
音声認識システムが、前記第1音声を認識する音声認識手順と、
音声認識システムが、前記第1音声を認識した認識結果、又は、点検内容を含む音声である第2音声を示す出力音声を出力する出力手順と、
音声認識システムが、前記第2音声を示す前記出力音声の出力を中断させる中断手順と、
音声認識システムが、前記中断手順による中断を解除する解除手順と、
を含み、
前記出力手順は、前記解除手順によって中断が解除されると、中断された第1時点で完了していた点検内容を示す音声を出力する
音声認識方法。
【請求項6】
請求項に記載の音声認識方法をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、設備点検等に用いられる音声認識システム、音声認識装置、音声認識方法、及び、プログラムに関する。
【背景技術】
【0002】
設備等を点検する上で、点検を行う者を支援する技術が知られている。
【0003】
例えば、タブレット端末、又は、ハンディーターミナル等によって、設備がバーコードで管理される。このようなバーコードを用いることで、機器の状況を素早く判断する。また、点検データが電子化されて集計及び管理されるため、点検のし忘れ、及び、点検の漏れといったヒューマンエラーを防止し、確実な点検の実施を支援する技術が知られている(例えば、非特許文献1等)。
【先行技術文献】
【非特許文献】
【0004】
【文献】"設備巡回点検システム"、[online]、[令和2年3月11日検索]、インターネット〈URL:http://www.tm-es.co.jp/service-product/services/products/mimawari-kun-mit.html〉
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来の技術では、点検が行われている間に、他の作業が割り込んできた場合等があっても、点検を中断できない場合が多い。そのため、点検が行われている間に他の作業が割り込んでくると、点検を最初からやり直す等の手間が発生する場合がある。
【0006】
本発明は、上記課題に鑑みてなされたものであり、点検を中断できることを目的とする。
【課題を解決するための手段】
【0007】
本発明の各実施形態による音声認識システム等は、以下のような構成を含む。
【0008】
音声認識システム(例えば、音声認識システム1である。)は、
第1音声(例えば、第1音声SD1である。)を入力する音声入力手段と、
前記第1音声を認識する音声認識手段(例えば、辞書D2である。)と、
前記第1音声を認識した認識結果、又は、第2音声を示す出力音声を出力する出力手段(例えば、ステップS02である。)と、
前記出力音声の出力を中断させる中断手段(例えば、中断操作C1である。)と
を含む。
【0009】
このような構成であると、点検を中断できる。
【0010】
また、音声認識システムは、設備の点検に用いられるのが望ましい(例えば、図6である)。
【0011】
このような構成であると、点検を効率良く行うことができる。
【0012】
また、音声認識システムは、
前記中断手段による中断を解除する解除手段(例えば、解除操作C2である。)を更に含み、
前記出力手段は、
前記解除手段によって中断が解除されると、中断された第1時点から前記出力音声の出力を再開する、又は、前記第1時点より前の第2時点から前記出力音声を出力するのが望ましい(例えば、図9である)。
【0013】
例えば、図10に示すように、事前に設定される複数の点検項目に基づいて、点検が行われる。このような点検作業の流れの中では、例えば、電話が鳴る、又は、他の人から話しかけられるといった割込となる作業が発生する場合がある。このような割込があった場合に、ユーザ13は、中断操作C1で点検を中断できるのが望ましい。このように、ユーザ13は、中断操作C1で点検を中断できると、点検を中断させた上で、割り込んできた作業を行うことができる。そして、割り込んできた作業の完了後、解除操作C2によって、ユーザ13は、点検を中断かつ再開できる。
【0014】
また、音声認識システムでは、
前記中断手段は、
前記出力音声の出力を中断させる中断操作が入力される、前記音声入力手段が前記第1音声を入力する、前記音声認識手段が所定の言葉を認識する、所定の動作が開始される、又は、これらの組み合わせが行われると、前記出力音声の出力を中断させるのが望ましい。
【0015】
このようなイヤホン12で操作ができる、又は、携帯端末11等による所定の動作の開始及び終了に連動すると、携帯端末11を取り出す手間等を省ける。
【0016】
また、音声認識装置(例えば、携帯端末11である。)は、
第1音声を入力する音声入力手段と、
前記第1音声を認識する音声認識手段と、
前記第1音声を認識した認識結果、又は、第2音声を示す出力音声を出力する出力手段と、
前記出力音声の出力を中断させる中断手段と
を含む。
【0017】
また、音声認識システムが行う音声認識方法(例えば、図8である。)であって、
音声認識システムが、第1音声を入力する音声入力手順と、
音声認識システムが、前記第1音声を認識する音声認識手順と、
音声認識システムが、前記第1音声を認識した認識結果、又は、第2音声を示す出力音声を出力する出力手順と、
音声認識システムが、前記出力音声の出力を中断させる中断手順と
を含む。
【0018】
また、音声認識方法をコンピュータに実行させるためのプログラムである(例えば、図8である)。
【発明の効果】
【0019】
本発明に係る各実施形態によれば、点検を中断できる。
【図面の簡単な説明】
【0020】
図1】音声認識システム1のシステム構成例を示す図である。
図2】情報処理装置のハードウェア構成例を示す図である。
図3】第1実施形態における全体処理例を示す図である。
図4】登録データベースD1の例を示す図である。
図5】第1実施形態における処理結果の例を示す図である。
図6】第1実施形態における携帯端末の画面表示例を示す図である。
図7】第1実施形態における機能構成例を示す図である。
図8】第2実施形態における全体処理例を示す図である。
図9】第2実施形態における処理結果の例を示す図である。
図10】第2実施形態における携帯端末の画面表示例を示す図である。
図11】第2実施形態における機能構成例を示す図である。
図12】グループ設定及び省略を行う変形例を示す図である。
図13】グループ設定の例を示す図である。
図14】第2入力データを前回結果とする例を示す図である。
図15】許容範囲を設定する例を示す図である。
図16】第2入力データを正常値又は正常範囲とする例を示す図である。
図17】第1辞書D211及び第2辞書D212を用いる変形例を示す図である。
図18】現場ごとにキャンセルの対象とする周波数帯域を設定する例を示す図である。
図19】中断及び解除の第1変形例を示す図である。
図20】中断及び解除の第2変形例を示す図である。
図21】音声入力及び音声出力の変形例を示す図である。
【発明を実施するための形態】
【0021】
以下、発明を実施するための最適かつ最小限な形態について、図面を参照して説明する。なお、図面において、同一の符号を付す場合には、同様の構成であることを示し、重複する説明を省略する。また、図示する具体例は、例示であり、図示する以外の構成が更に含まれる構成であってもよい。
【0022】
<第1実施形態>
<全体構成例>
図1は、音声認識システム1のシステム構成例を示す図である。例えば、音声認識システム1は、サーバ10、音声認識装置の例である携帯端末11、及び、イヤホン12を含む構成である。
【0023】
サーバ10、携帯端末11、及び、イヤホン12は、ネットワークNWを介して接続する。
【0024】
図示するように、ユーザ13は、イヤホン12を装着して、設備の点検を行う。また、ユーザ13は、携帯端末11を持って設備の点検を行う。一方で、サーバ10は、設備の点検が行われる現場とは異なる位置に設置される。したがって、設定値及びデータ等は、サーバ10にあらかじめ入力され、点検を行う際に、携帯端末11は、ネットワークNWを介して、設定値及びデータ等を取得する。
【0025】
点検の対象となる設備は、例えば、空調設備等である。したがって、点検の現場は、企業における機械室等である。そして、点検では、圧力計、電圧計、電流計、薬液残量計、温度計、及び、湿度計等の計測器が示す値が、ユーザ13によって点検される。
【0026】
サーバ10及び携帯端末11は、情報処理装置である。例えば、情報処理装置は、以下のようなハードウェア構成の装置である。
【0027】
<ハードウェア構成例>
図2は、情報処理装置のハードウェア構成例を示す図である。例えば、サーバ10等の情報処理装置は、CPU(Central Processing Unit、以下「CPUHW1」という。)、記憶装置HW2、ネットワークインタフェースHW3、入力装置HW4、出力装置HW5、及び、インタフェースHW6を有するハードウェア構成である。
【0028】
CPUHW1は、演算装置及び制御装置の例である。
【0029】
記憶装置HW2は、主記憶装置及び補助記憶装置等である。
【0030】
ネットワークインタフェースHW3は、ネットワークを介して外部装置等とデータを送受信する通信装置である。
【0031】
入力装置HW4は、ユーザの操作を入力するための装置である。例えば、入力装置HW4は、マウス、及び、キーボード等である。
【0032】
出力装置HW5は、処理結果をユーザに出力するための装置である。例えば、出力装置HW5は、ディスプレイ等である。
【0033】
インタフェースHW6は、周辺機器を接続するためのコネクタ等である。
【0034】
イヤホン12は、音声を入力する入力装置である。そして、イヤホン12を介して入力されるユーザ13が発する音声は、携帯端末11に入力されて、音声認識等の処理が行われる。また、イヤホン12は、音声を出力する出力装置である。したがって、イヤホン12は、ユーザ13に対して、携帯端末11による処理によって音声を出力する。
【0035】
以下、ユーザ13がイヤホン12で入力する音声を「第1音声SD1」という。一方で、イヤホン12を介してユーザ13に出力される音声を「第2音声SD2」という。
【0036】
<全体処理例>
図3は、第1実施形態における全体処理例を示す図である。以下、図示するように、全体処理を「事前処理」と「本処理」に分けて説明する。「事前処理」は、「本処理」より前に行われる、音声認識システム1を運用する準備となる処理である。したがって、「事前処理」と「本処理」は連続して行われなくともよく、「事前処理」が「本処理」が開始されるまでに完了していればよい。
【0037】
<事前処理の例>
「事前処理」では、以下のような処理が行われる。
【0038】
ステップS01では、音声認識システム1は、例えば、点検項目、及び、第2音声SD2用のデータ等を登録して、登録データベースD1を構築する。すなわち、登録データベースD1は、点検において、第2音声SD2となって読み上げられる内容を示す。また、入力される音声のデータのうち、どのデータをどのタイミングで第2音声SD2として出力すればよいかといった点検項目との対応付けも、登録データベースD1上に登録される。例えば、このように登録手順が行われる。このようにして、「事前処理」では、音声認識システム1は、「本処理」で第2音声SD2を出力できるようにするためのデータの入力及び設定を行う。具体的には、登録データベースD1は、以下のように構築される。
【0039】
図4は、登録データベースD1の例を示す図である。図示するように、登録データベースD1は、「項目番号」及び「点検項目」で構成される。
【0040】
例えば、第2音声SD2で出力される内容は、「点検項目」に入力される内容である。具体的には、「点検項目」には、点検の対象となる設備を特定する設備の名称(例えば、「項目番号」が「1」の例では、「消火ポンプ」である。)等が入力される。したがって、第2音声によって設備の名称が読み上げられると、ユーザ13は、第2音声SD2を聞いて、これから点検する対象となる設備を特定できる。
【0041】
さらに、「点検項目」には、図示するように、詳細な点検内容が入力される。具体的には、詳細な点検内容は、「項目番号」が「1」の例における「圧力値」である。このような詳細な点検内容が第2音声によって読み上げられると、ユーザ13は、第2音声SD2を聞いて、圧力値を点検し、第1音声SD1で圧力値を入力する作業を行うことが分かる。
【0042】
また、ステップS01では、音声認識システム1は、辞書D2を入力する。すなわち、「事前処理」では、音声認識システム1は、「本処理」において第1音声SD1で入力される音声を言葉として認識する、音声認識が可能となるようにするためのデータの入力及び設定を行う。
【0043】
<本処理の例>
「本処理」は、点検の開始に応じて開始される。
【0044】
ステップS02では、音声認識システム1は、登録された第2音声SD2を出力する出力手順を行う。
【0045】
以下、ステップS02が実行されている間、すなわち、第2音声SD2が出力されている間に第1音声SD1が入力されるとする。このような場合には、音声認識システム1は、ステップS03に進む。
【0046】
ステップS03では、音声認識システム1は、第1音声SD1を入力する音声入力手順を行う。すなわち、ステップS03では、音声認識システム1は、ユーザ13が音声を発したのを感知する。このように、第1音声SD1が入力されると、音声認識システム1は、ステップS04に進む。
【0047】
ステップS04では、音声認識システム1は、第2音声SD2の出力を制限する制限手順を行う。
【0048】
ステップS05では、音声認識システム1は、第1音声SD1に基づいて音声認識を行う音声認識手順を行う。
【0049】
ステップS06では、音声認識システム1は、第1音声SD1を音声認識した音声認識結果を第2音声SD2で出力する。
【0050】
例えば、以上のような全体処理が行われると、以下のような処理結果となる。
【0051】
図5は、第1実施形態における処理結果の例を示す図である。以下、制限を行わない「第1項目実行例」と制限を行う「第2項目実行例」を比較して説明する。
【0052】
「第1項目実行例」では、まず、音声認識システム1は、第2音声SD2によって第11出力EX11を出力する。この例では、第11出力EX11は、「消火ポンプ:圧力」というように、点検の対象となる設備の名称、及び、点検の内容を続けて示す音声である。
【0053】
第11出力EX11に対して、ユーザ13は、第11出力EX11で示す設備を点検した結果を示す第12出力EX12を第1音声SD1で、音声認識システム1に入力する操作を行う。具体的には、この例では、ユーザ13は、「消火ポンプ」の設備が有する圧力計が示す「圧力」の値である「12.3」を読み上げる。この読み上げで発せられる音声が第12出力EX12となる。
【0054】
次に、この例では、音声認識システム1は、第12出力EX12を音声認識する。そして、第13出力EX13で、点検が完了した内容、かつ、音声認識結果を第2音声SD2によって出力する。図示するように、第13出力EX13で出力される内容のうち、前半は、第11出力EX11の復唱である。続いて、第13出力EX13では、後半で、音声認識結果、すなわち、第12出力EX12と同様の内容が続けて出力される。このように、制限をせず、かつ、音声認識が正しく行われた場合には、音声認識システム1は、点検項目等の出力、点検結果の入力、音声認識、及び、音声認識結果の出力という順で動作する。
【0055】
このような動作が可能な音声認識システム1に対して、「第2項目実行例」では、第2音声SD2が出力されている間に、ユーザ13は、第1音声SD1を入力して、第2音声SD2の出力を制限する。
【0056】
図示する例では、制限の対象となる第2音声SD2を第21出力EX21とする例である(ステップS02)。第21出力EX21は、第11出力EX11が示す点検項目の次になる点検項目である。そして、第21出力EX21は、制限されない場合には、「消火ポンプ:外観」という内容である。
【0057】
図示するように、「第2項目実行例」では、第21出力EX21が出力されている(ステップS02)途中で、ユーザ13は、第21出力EX21で示す設備を点検した結果を示す第22出力EX22を第1音声SD1で、音声認識システム1に入力する操作を行う(ステップS03)。
【0058】
このように、第21出力EX21が出力されている間に、第22出力EX22が入力されると、音声認識システム1は、第21出力EX21の出力を制限する制限処理PR1を行う(ステップS04)。例えば、制限処理PR1は、第21出力EX21の出力を停止させる処理である。
【0059】
また、ユーザ13は、「消火ポンプ」の設備の外観をチェックした結果である「× 液漏れあり」を読み上げる(ステップS03)。この読み上げで発せられる音声が第22出力EX22となる。
【0060】
次に、この例では、音声認識システム1は、第22出力EX22を音声認識する(ステップS05)。そして、音声認識システム1は、第23出力EX23で、第13出力EX13と同様に、点検が完了した内容、かつ、音声認識結果を第2音声SD2によって出力する(ステップS06)。図示するように、第23出力EX23で出力される内容のうち、前半は、第21出力EX21の復唱である。続いて、第23出力EX23では、後半で、音声認識結果、すなわち、第22出力EX22と同様の内容が続けて出力される。
【0061】
<画面表示例>
図6は、第1実施形態における携帯端末の画面表示例を示す図である。例えば、点検は、以下のような順序で行われる。ただし、図示するような画面表示、順序及び入力項目は必須ではない。
【0062】
図6(A)は、「メインメニュー」を示す画面である。以下、図6(A)に示す画面を第11画面PN11という。第11画面PN11で「点検フロー」が押されると、点検を行う準備を行う画面である図6(B)に画面が遷移する。
【0063】
図6(B)は、「点検フロー一覧」を選択する画面である。以下、図6(B)に示す画面を第12画面PN12という。第12画面PN12は、点検を行う対象となる設備を選ぶ画面である。次に、第12画面PN12で設備が選ばれると、点検を行うユーザ13を指定する画面である図6(C)に画面が遷移する。
【0064】
図6(C)は、「作業者の選択」を行う画面である。以下、図6(C)に示す画面を第13画面PN13という。第13画面PN13は、これから点検を行う作業者となるユーザ13を選ぶ画面である。次に、第13画面PN13でユーザ13が選ばれると、点検が開始され、図6(D)に画面が遷移する。
【0065】
図6(D)は、第1番目の点検項目用画面である。以下、図6(D)に示す画面を第14画面PN14という。第14画面PN14は、「点検項目書」に、点検の対象となる設備の名称及び点検の進捗度を示す。また、第14画面PN14は、「点検項目」に、点検内容となる「缶内圧力」を示す。例えば、第14画面PN14の表示に応じて、同様の内容を示す第2音声SD2が出力される(ステップS02)。次に、点検結果を示す第1音声SD1が入力されると(ステップS03)、音声認識が行われて(ステップS05)、図6(E)に画面が遷移する。
【0066】
図6(E)は、第1番目の点検結果を示す画面である。以下、図6(E)に示す画面を第15画面PN15という。第15画面PN15は、第14画面PN14と比較すると、認識結果に「0.66」という数値が表示される点が異なる。この「0.66」は、第1音声SD1を音声認識した結果である。このように、音声認識結果が画面に表示されると、ユーザ13は、音声認識結果を確認しやすい。
【0067】
例えば、以上のように、第1番目の点検項目について点検が行われる。以下、2番目以降の点検項目も同様に処理が行われる。
【0068】
図6(F)は、第2番目の点検項目用画面である。以下、図6(F)に示す画面を第16画面PN16という。第1番目の点検項目が「缶内圧力」であったのに対して、第16画面PN16では、点検項目が「押込ファン電流値」となる。そして、第16画面PN16では、第1番目の点検項目と同様に、画面と同様の内容を示す第2音声SD2が出力される(ステップS02)。次に、点検結果を示す第1音声SD1が入力されると(ステップS03)、音声認識が行われて(ステップS05)、図6(G)に画面が遷移する。
【0069】
図6(G)は、第2番目の点検結果を示す画面である。以下、図6(G)に示す画面を第17画面PN17という。第17画面PN17は、第16画面PN16と比較すると、認識結果に「43」という数値が表示される点が異なる。この「43」は、第1音声SD1を音声認識した結果である。
【0070】
例えば、第14画面PN14又は第16画面PN16において、画面と同様の内容を示す第2音声SD2が出力されている間に、第1音声SD1が入力されると、音声認識システム1は、第2音声SD2の出力が制限して(ステップS04)、音声認識の開始、及び、次の画面に遷移する。
【0071】
<機能構成例>
図7は、第1実施形態における機能構成例を示す図である。例えば、音声認識システム1は、音声入力手段1F11、音声認識手段1F12、登録手段1F13、出力手段1F14、制限手段1F15、入力データ生成手段1F16、記憶手段1F17、判断手段1F18、ノイズキャンセル手段1F19、グループ設定手段1F20、及び、省略操作手段1F21を含む機能構成である。
【0072】
音声入力手段1F11及び出力手段1F14は、例えば、イヤホン12等で実現される。また、音声認識手段1F12、登録手段1F13、制限手段1F15、入力データ生成手段1F16、記憶手段1F17、判断手段1F18、ノイズキャンセル手段1F19、グループ設定手段1F20、及び、省略操作手段1F21は、携帯端末11又はサーバ10が有するCPUHW1、記憶装置HW2、入力装置HW4、出力装置HW5、及び、インタフェースHW6等の演算装置、記憶装置、入力装置、及び、出力装置等が協働して動作して実現する。
【0073】
特に、点検を行うユーザ13が点検に慣れているような場合には、点検の内容及び順序といった詳細が第2音声SD2で案内されなくとも、熟知している場合がある。このような場合には、ユーザ13は、第2音声SD2がすべて出力され終わる前に、点検結果を第1音声SD1で入力して、点検を早く終わらせたい場合がある。そこで、上記の例のように、第2音声SD2の出力をしている間に、第1音声SD1が入力されると、第2音声SD2の出力が制限されるのが望ましい。このように、第2音声SD2の出力を制限して、第1音声SD1が入力できるようになると、ユーザ13は、第2音声SD2が出力され終わるのを待たずに済むため、音声の入力を行うための時間を短縮できる。
【0074】
<第2実施形態>
第2実施形態は、第1実施形態と同様のシステム構成である音声認識システム1で実現する。また、第2実施形態における携帯端末11及びサーバ10のハードウェア構成も第1実施形態と同様とする。第2実施形態は、第1実施形態と比較すると、全体処理が異なる。以下、異なる点を中心に説明し、重複する説明を省略する。
【0075】
<全体処理例>
図8は、第2実施形態における全体処理例を示す図である。第1実施形態と比較すると、第2実施形態は、ステップS21乃至ステップS23が行われる点が異なる。また、第2実施形態における「事前処理」は、第1実施形態と同様とする。
【0076】
ステップS02では、音声認識システム1は、登録された第2音声SD2を出力する。
【0077】
以下、ステップS02が実行されている間、すなわち、第2音声SD2が出力されている間に、中断操作C1が入力される例で説明する。このような場合には、音声認識システム1は、ステップS21に進む。なお、中断操作C1がどのような操作かは、事前に設定される。
【0078】
ステップS21では、音声認識システム1は、中断操作C1を入力する。このように、中断操作C1が入力されると、音声認識システム1は、第2音声SD2の出力を中断させる。
【0079】
また、音声認識システム1は、第2音声SD2の出力を中断している間に中断を解除する解除操作C2が入力されると、ステップS22に進む。なお、解除操作C2がどのような操作かは、事前に設定される。
【0080】
ステップS22では、音声認識システム1は、解除操作C2に基づいて、中断を解除する。
【0081】
ステップS23では、音声認識システム1は、第2音声SD2の出力を再開する。
【0082】
例えば、以上のような全体処理が行われると、以下のような処理結果となる。
【0083】
図9は、第2実施形態における処理結果の例を示す図である。以下、第2実施形態における「第2項目実行例」の第21出力EX21を中断の対象とする例で説明する。
【0084】
例えば、第21出力EX21を示す出力音声が出力されている(ステップS02)間に、中断操作C1が入力されるとする。そして、中断操作C1が入力されると、音声認識システム1は、中断処理PR2を行う(ステップS21)。以下、中断操作C1を入力して、中断した時点を「第1時点」という。
【0085】
中断処理PR2は、図示するように、第21出力EX21の途中で出力を止める処理である。さらに、中断処理PR2は、中断した時点以降、解除操作C2が入力されるまで出力を行わないようにする処理である。
【0086】
次に、解除操作C2が入力されると、音声認識システム1は、中断を解除する(ステップS22)。具体的には、解除操作C2が入力されると、音声認識システム1は、第200出力EX200を示す出力音声を出力し、第21出力EX21を示す出力音声の出力を再開する。
【0087】
第200出力EX200は、第1時点で完了していた点検の内容を示す出力音声である。このような出力音声によって、ユーザ13に、どこまで点検が終わっていたかを思い出させる。
【0088】
そして、第200出力EX200が出力された後、第21出力EX21の出力が再開される(ステップS23)。
【0089】
<画面表示例>
図10は、第2実施形態における携帯端末の画面表示例を示す図である。例えば、点検は、以下のような順序で行われる。ただし、図示するような画面表示、順序及び入力項目は必須ではない。
【0090】
図10(A)は、第1番目の点検結果を示す画面である。以下、図10(A)に示す画面を第21画面PN21という。第21画面PN21は、第1番目に行う点検の内容が「蒸気温度」であって、点検結果として「120」が入力された場合に表示される画面の例である。図示するように、テキスト出力B2によって音声認識結果が出力される。そして、テキスト出力B2を見て音声認識結果が誤っている場合には、再入力ボタンB1を押して、再度、点検結果を入力できるのが望ましい。
【0091】
同様に、第2番目、第3番目、及び、第4番目の順序で点検が行われる。そして、この例では、図10(B)に示す第22画面PN22が、第2番目の点検結果が入力された場合に表示される画面の例である。
【0092】
図10(C)に示す第23画面PN23は、第3番目の点検結果が入力された場合に表示される画面の例である。そして、図10(D)に示す第24画面PN24は、第4番目の点検結果が入力された場合に表示される画面の例である。
【0093】
<機能構成例>
図11は、第2実施形態における機能構成例を示す図である。例えば、音声認識システム1は、音声入力手段1F11、音声認識手段1F12、出力手段1F14、解除手段1F101、及び、中断手段1F100を含む機能構成である。
【0094】
音声入力手段1F11及び出力手段1F14は、例えば、イヤホン12等で実現される。また、音声認識手段1F12、解除手段1F101、及び、中断手段1F100は、携帯端末11又はサーバ10が有するCPUHW1、記憶装置HW2、入力装置HW4、出力装置HW5、及び、インタフェースHW6等の演算装置、記憶装置、入力装置、及び、出力装置等が協働して動作して実現する。
【0095】
例えば、図10に示すように、事前に設定される複数の点検項目に基づいて、点検が行われる。このような点検作業の流れの中では、例えば、電話が鳴る、又は、他の人から話しかけられるといった割込となる作業が発生する場合がある。このような割込があった場合に、ユーザ13は、中断操作C1で点検を中断できるのが望ましい。このように、ユーザ13は、中断操作C1で点検を中断できると、点検を中断させた上で、割り込んできた作業を行うことができる。そして、割り込んできた作業の完了後、解除操作C2によって、ユーザ13は、点検を中断かつ再開できる。
【0096】
<変形例>
なお、点検項目は、数値、又は、「〇」若しくは「×」(「YES」若しくは「NO」等でもよい。)の形式で入力及びチェックされる「定式」と、「漏れあり」等のようにユーザ13がコメントで入力する「非定式」があってもよい。また、点検結果は、ユーザ13が撮影した画像等が添付できてもよい。
【0097】
なお、音声認識システム1は、設備の点検以外に用いられてもよい。すなわち、点検の対象となる対象物は、設備以外の装置でもよい。また、音声認識システム1は、点検以外に用いられてもよい。
【0098】
音声認識システム1が設備の点検に用いられると、設備の点検を行う作業時間を短縮させて、作業の省力化ができる。
【0099】
なお、音声認識システム1は、空調設備機器の機械室における点検で用いられるのが望ましい。空調設備機器の機械室における点検では、点検箇所が機械室内で点在する場合が多い。また、多数の大型機器が設置されている場合には、個々の大型機器について、点検の対象となるメータ類も点在する場合が多い。このような機械室では、点検項目も多岐にわたる場合が多い。そして、このような多数の点検を行う場合には、ユーザは、点検をするために多く移動する。また、場合によっては、ユーザは、移動において梯子を登る等の移動もあり得る。
【0100】
さらに、ユーザは、点検では、照明を点灯させる(そして、終了後は消灯させる。)、又は、動力盤の扉を開ける等の付随的な作業も行う。そのため、点検結果の入力等をできるだけ手作業で入力するのをなくしたい事情がある。そこで、音声認識システム1によって、音声で点検結果等を入力できると、ユーザは点検を行いやすい。
【0101】
また、上記のような機械室での点検のように、移動が多い場合には、他の作業者及び管理者等から点検を行っている間に声を掛けられる可能性も高くなる。そのため、音声認識システム1で中断及び解除ができると、点検を中断し、再開できるため、点検を効率良く行うことができる。
【0102】
また、設備及びメータ類等の配置によっては、1か所に複数の計器類が設置される場合もある。このような設置状況下では、1か所で多くの点検結果を入力する場合も多い。そのため、装置による音声の出力が終わるまで待ってから音声入力を行うと、音声の入力を行うための待ち時間が長くなるので点検に時間がかかる。一方で、装置による音声の出力を制限して、音声が入力できる構成であると、ユーザは、音声が出力され終わるのを待たずに済むため、音声の入力を行うための時間を短縮できる。ゆえに、点検を効率良く行うことができる。 音声を出力するのに用いられるイヤホン12は、内耳式であるのが望ましい。内耳式は、イヤホン12を装着した際に、外部からの音を遮音する形状である。例えば、設備が稼働中の現場では、設備が稼働する音等によるノイズが多い環境で場合が多い。そのため、内耳式のイヤホン12であると、ノイズが多い環境であっても、出力される音声が聞き取りやすい。また、骨伝導方式のイヤホンと比較すると、内耳式である方が小型化できる場合が多い。
【0103】
点検項目に対して、順序、及び、点検の要否等が設定できてもよい。例えば、第2音声SD2は、登録データベースD1における「項目番号」の順に出力を行う。そこで、点検を行う前に、「事前処理」において、「項目番号」の設定、又は、「点検項目」と「項目番号」の対応付けを変更して、点検が行われる順序を変更できてもよい。
【0104】
また、点検を行わない「点検項目」を「OFF」にするような設定ができてもよい。
【0105】
点検する項目は、設備の稼働状況等によって異なる場合がある。したがって、順序及び点検の要否が設定できると、点検を行う日の稼働状況等に揃えて柔軟に点検する内容を変更できる。
【0106】
情報処理装置は、上記に示すハードウェア構成に限られない。例えば、情報処理装置は、上記に示す以外の演算装置、制御装置、記憶装置、入力装置、出力装置、及び、周辺機器を更に有するハードウェア構成でもよい。また、入力装置及び出力装置が一体となってタッチパネル等でもよい。なお、携帯端末11及びサーバ10は、異なるハードウェア構成の装置でもよい。さらに、周辺機器及び他の装置との接続は、有線でもよいし、無線でもよい。
【0107】
また、携帯端末11は、タブレット、スマートフォン、又は、モバイルパソコン等の情報処理装置でもよい。
【0108】
<制限処理の変形例>
なお、制限処理PR1は、第2音声SD2の出力を停止する処理に限られない。例えば、制限処理PR1は、第2音声SD2の音量を小さくして第2音声SD2を制限する処理でもよい。また、制限処理PR1は、第2音声SD2の音量を徐々に小さくして第2音声SD2を制限する処理でもよい。このように、制限処理PR1は、通常よりも音量を絞って第2音声SD2の出力を制限してもよい。
【0109】
又は、制限処理PR1は、第2音声SD2の次に出力させる音声の出力を開始する第2音声SD2を制限する処理でもよい。このように、制限処理PR1は、現在、第2音声SD2で示している点検項目から次の点検項目に進むようにして、第2音声SD2の出力を制限してもよい。
【0110】
ほかにも、制限処理PR1は、第2音声SD2の出力速度を速くして第2音声SD2を制限する処理でもよい。すなわち、制限処理PR1は、第2音声SD2を早送り再生して、第2音声SD2の出力を制限してもよい。
【0111】
このような制限処理PR1が行われると、不要な音声の出力を少なくできる。
【0112】
<グループ設定及び省略を行う変形例>
なお、点検は、一部が省略できてもよい。例えば、省略は、以下のような処理である。
【0113】
図12は、グループ設定及び省略を行う変形例を示す図である。以下、点検の対象となる設備が「第1設備」、「第2設備」、「第3設備」、及び、「第4設備」であり、この順序で点検を行う例で説明する。
【0114】
この例では、第1実施形態等と同様に、第1設備についての点検項目が、第31出力EX31で出力されるとする。また、この例では、第31出力EX31を含む第1設備についての点検が省略の対象であるとする。
【0115】
省略を行う場合には、ユーザ13は、省略操作C3を行う。例えば、省略操作C3は、所定のボタンを押す、又は、「省略」等のように事前に設定される言葉を第1音声SD1で入力する等の操作である。なお、省略操作C3がどのような操作かは事前に設定される。
【0116】
図示するように、第31出力EX31が出力されている間に、省略操作C3が行われると、音声認識システム1は、第31出力EX31を含む第1設備の点検を省略する省略処理PR3を行う。例えば、省略処理PR3は、第31出力EX31の出力を中止して、第2設備の点検に進む処理である。したがって、省略操作C3が行われると、音声認識システム1は、第2設備についての点検項目を示す第32出力EX32の出力を開始する。
【0117】
なお、事前に登録される点検項目のうち、どの点検項目が第1設備の点検に対応するかは、例えば、以下のようなグループ設定に基づいて把握される。
【0118】
図13は、グループ設定の例を示す図である。例えば、図示するような点検項目が事前に登録された場合を例に説明する。この例では、「項目番号」が「1」及び「2」の「点検項目」が第1設備についての点検である。同様に、「項目番号」が「3」乃至「5」の「点検項目」が第2設備についての点検である。さらに、「項目番号」が「6」の「点検項目」が第3設備についての点検である。さらにまた、「項目番号」が「7」の「点検項目」が第4設備についての点検である。
【0119】
これらの複数の点検項目に対して、グループGSが設定される。例えば、グループGSは、図示するように、音声認識システム1は、「グループ」に数値を入力して設定するグループ設定手順を行う。この例では、「項目番号」が「1」及び「2」の「点検項目」をまとめて「G1」というグループに設定した例である。同様に、この例では、「項目番号」が「3」乃至「5」の「点検項目」をまとめて「G2」というグループに設定した例である。なお、グループGSは、設備ごとに限られず、「G3」のように、第3設備及び第4設備の点検項目をまとめて1つのグループに設定してもよい。
【0120】
図12に示すように、例えば、第1設備についての点検に対応する第31出力EX31に対して省略操作C3がされた場合には、音声認識システム1は、省略操作C3が「G1」というグループに対応する操作であると判断する。
【0121】
図13に示すように、「G1」のグループGSには、「項目番号」が「1」及び「2」の「点検項目」が属する。ゆえに、音声認識システム1は、「項目番号」が「1」及び「2」の「点検項目」を示す第2音声SD2を省略する省略手順を行う。
【0122】
なお、省略操作C3は、省略するグループ又は設備の名称を入力する操作でもよい。
【0123】
設備は、例えば、稼働していない場合には、点検を行わなくともよい場合がある。そのような設備に対する点検を省略できると、点検を効率良く行うことができる。
【0124】
<チェックを行う変形例>
音声認識システム1は、点検結果をチェックして設備に異常があるか否かを判断する構成が望ましい。以下、チェックの対象となる値、すなわち、第1音声SD1で入力される内容であって音声認識された結果を示すデータを「第1入力データ」という。一方で、第1データをチェックするのに用いられるデータを「第2入力データ」という。
【0125】
音声認識システム1は、第1入力データが第1データ生成手順、すなわち、音声認識によって生成されると、第1入力データと第2入力データを比較して異常であるか否かを判断する判断手順を行う。
【0126】
第2入力データは、第1入力データより前、すなわち、第1入力データをチェックするまでに記憶手順によって記憶されていればよい。例えば、第2入力データは、以下のように記憶される。
【0127】
図14は、第2入力データを前回結果とする例を示す図である。以下、第1実施形態と同様の点検項目である場合を例に説明する。例えば、第2入力データは、図示する「第2入力データ」のように、それぞれの「点検項目」に対応して記憶される前回の点検結果(以下「前回結果V21」という。)である。
【0128】
なお、前回結果V21は、前回の点検で異常がなかったのを前提とする。したがって、前回の点検で異常があった場合には、それ以前の点検結果又は正常値が前回結果V21に入力されてもよい。
【0129】
つまり、音声認識システム1は、第1入力データ、すなわち、今回の点検結果を前回結果V21と比較して違いがあるか否かを判断する。そして、音声認識システム1は、第1入力データと第2入力データが異なると、異常であると判断する。
【0130】
なお、正常と判断する範囲には、ある程度の許容範囲があってもよい。すなわち、音声認識システム1は、第1入力データが第2入力データに対して許容範囲外であると、異常であると判断する。例えば、許容範囲は、以下のように設定される。
【0131】
図15は、許容範囲を設定する例を示す図である。例えば、許容範囲V22は、図示する「許容範囲」のように、前回結果V21から結果が外れても「正常」と判断する範囲を示す。なお、この例は、「項目番号」が「2」の場合のように、前回結果V21と一致しない場合をすべて「異常」と判断させるために、許容範囲V22に「なし」と設定する例である。
【0132】
このように、許容範囲V22によって、前回結果V21に対して幅を持たせる構成であってもよい。特に、数値が点検の対象となる場合には、数値の微小な変動が異常でない場合が多い。したがって、このように許容できる範囲が設定できると、異常を精度良く判断できる。
【0133】
このように、前回結果V21、すなわち、直近の点検結果と比較して、違いがあるような場合には、設備に異常があると判断される。このようなチェックが行われると、音声認識システム1は、異常が発生しているような設備を知らせることができる。
【0134】
なお、チェックは、以下のように第2入力データに正常値又は正常範囲を示す値を設定して行われてもよい。
【0135】
図16は、第2入力データを正常値又は正常範囲とする例を示す図である。例えば、図示する「第2入力データ 正常値又は正常範囲」のような値(以下「正常値V23」という。)が事前に設定されてもよい。
【0136】
正常値V23が設定されると、音声認識システム1は、正常とする値又は範囲を把握できる。したがって、音声認識システム1は、第1入力データを正常値V23と比較して、第1入力データと第2入力データが異なる、又は、第1入力データが正常範囲の範囲外であると、異常であると判断する。このようなチェックが行われると、音声認識システム1は、異常が発生しているような設備を知らせることができる。
【0137】
<第1辞書及び第2辞書を用いる変形例>
なお、携帯端末11にデータ及びプログラム等がダウンロードされて、携帯端末11で全体処理が行われてもよい。例えば、点検を行う現場は、通信環境が良くない場合がある。すなわち、現場は、携帯端末11とサーバ10の間で通信を行うのが難しい通信環境である場合がある。
【0138】
そこで、点検を開始する前に、サーバ10から事前に入力される設定値等がダウンロードされて、点検を行っている間は、携帯端末11とサーバ10の間で通信が行われなくとも全体処理が完了できる構成であってもよい。なお、この場合には、点検が完了し、携帯端末11とサーバ10の間で通信が行える環境となった場合に、携帯端末11からサーバ10へ点検結果等をアップロードしてもよい。
【0139】
このような場合等において、音声認識を行うために用いる辞書が、以下のように点検の分野用の辞書であるのが望ましい。
【0140】
図17は、第1辞書D211及び第2辞書D212を用いる変形例を示す図である。以下、サーバ10のようにネットワークNWを介して利用できる情報処理装置を「第1情報処理装置」という。第1情報処理装置に対して、現場でユーザ13が利用できる携帯端末11のような情報処理装置を「第2情報処理装置」という。
【0141】
図示するように、第1情報処理装置で音声認識に用いられる辞書を「第1辞書D211」という。一方で、第2情報処理装置で音声認識に用いられる辞書を「第2辞書D212」という。
【0142】
第2情報処理装置は、携帯する情報処理装置であるため、記憶領域MEMが第1情報処理装置と比較すると小さくなりやすい。
【0143】
第2辞書D212は、点検の分野用の辞書である。したがって、第1辞書D211より、第2辞書D212は、データの容量を小さくできる。そのため、第2辞書D212は、第2情報処理装置のように、第1情報処理装置と比較して、記憶装置の記憶できる容量が小さい記憶領域MEMの情報処理装置であっても、記憶できる辞書が用いられるのが望ましい。
【0144】
点検の分野用の辞書は、点検に良く用いられる用語を音声認識するのに適する辞書である。例えば、点検の分野用の辞書は、数値、点検結果に用いられる用語及び設備の名称等が設定される。このように、点検において使用頻度が高い用語に絞った辞書が用いられると、音声認識を小さい記憶領域で実現でき、かつ、精度良く音声認識を実行して第1入力データV10を生成できる。
【0145】
<ノイズキャンセルの変形例>
音声認識システム1は、第1音声SD1に含まれるノイズをキャンセルする構成が望ましい。そして、第1音声SD1ノイズをキャンセルした音声(以下「第3音声」という。)に基づいて、音声認識が行われるのが望ましい。
【0146】
ノイズのキャンセルは、例えば、ローパスフィルタ、及び、バンドパスフィルタ等のフィルタ又は複数のフィルタの組み合わせによって、対象する周波数帯域に含まれるノイズを減衰するようにして行われる。例えば、フィルタは、デジタルフィルタ、又は、フィルタリングを行う回路等によって実現する。
【0147】
また、キャンセルの対象となる周波数帯域は、現場又は位置ごとに個別に設定されるのが望ましい。以下、現場ごとに、キャンセルの対象とする周波数帯域を設定する場合の例を説明する。
【0148】
図18は、現場ごとにキャンセルの対象とする周波数帯域を設定する例を示す図である。以下、図18(A)を「第1現場」用とし、図18(B)を「第2現場」用とする。なお、キャンセルの対象とする周波数帯域は、GPS等を用いて位置情報に基づいて設定されてもよい。
【0149】
例えば、第1現場において、一定時間の音声(ユーザ13が発する音声はない状態であるとする。)を入力し、音声を入力したデータに対して周波数解析(例えば、FFT(高速フーリエ変換、Fast Fourier Transform)等である。)を行うと、図18(A)及び図18(B)のような周波数解析結果が得られる。
【0150】
図18(A)は、第1現場で、図18(A)に示すような周波数帯域(以下「第1周波数帯域FR1」という。)に、ノイズ(以下、第1現場で発生するノイズを「第1ノイズNZ1」という。)が発生する例である。
【0151】
図18(B)は、第2現場で、図18(B)に示すような周波数帯域(以下「第2周波数帯域FR2」という。)に、ノイズ(以下、第2現場で発生する2つのノイズを「第2ノイズNZ2」及び「第3ノイズNZ3」という。)が発生する例である。
【0152】
ノイズは、現場又は位置ごとに異なる場合がある。例えば、現場ごとに、稼働している設備の種類が異なると、設備は、異なる音を発する場合があるため、ノイズの発生する周波数帯域も異なるようになる場合がある。この例では、第1現場は、第1ノイズNZ1が発生するのに対して、第2現場は、第2ノイズNZ2及び第3ノイズNZ3が発生する。この例では、第1現場は、第2現場よりも低い周波数帯域でノイズが発生する。
【0153】
そのため、第1現場では、第1ノイズNZ1を減衰させるため、第1周波数帯域FR1がキャンセルの対象となるのが望ましい。一方で、第2現場では、第2ノイズNZ2及び第3ノイズNZ3を減衰させるため、第2周波数帯域FR2がキャンセルの対象となるのが望ましい。
【0154】
第1周波数帯域FR1及び第2周波数帯域FR2は、例えば、点検を行う前に現場又は位置ごとに音声を解析して設定される。なお、周波数帯域の設定は、数値で入力できてもよい。
【0155】
このようにすると、それぞれの現場又は位置に適したノイズのキャンセルができる。そのため、音声に含まれるノイズを減衰させた第3音声で音声認識ができるため、音声認識の精度を向上させることができる。
【0156】
<中断及び解除の変形例>
中断処理PR2は、以下のように、音声認識システム1が、音声認識によって所定の言葉を認識する場合に行われてもよい。
【0157】
図19は、中断及び解除の第1変形例を示す図である。以下、第2実施形態と同様の第2音声SD2を出力する場合を例に説明する。第2実施形態と比較すると、この変形例は、中断及び解除に所定の言葉を用いる点が異なる。
【0158】
この例では、音声認識システム1は、第1音声SD1で「ポーズ」という言葉(以下「中断音声C11」という。)を入力すると、第2音声SD2の出力を中断する。
【0159】
そして、中断の後、音声認識システム1は、第1音声SD1で「解除」という言葉(以下「解除音声C21」という。)を入力すると、中断を解除する。
【0160】
なお、中断音声C11及び解除音声C21がどのような言葉かは、事前に設定される。
【0161】
このように、所定の言葉で中断及び解除が操作できると、ユーザ13は、例えば、手に道具を持つような場合等でも操作を行うことができ、操作性を向上できる。
【0162】
図20は、中断及び解除の第2変形例を示す図である。この例は、図示するように、イヤホン12が有するボタンを押す操作が中断操作となる例である。
【0163】
例えば、1回目のボタンを押す操作(以下「第1操作C12」という。)によって、音声認識システム1は、第2音声SD2の出力を中断する。
【0164】
次に、2回目のボタンを押す操作(以下「第2操作C22」という。)によって、音声認識システム1は、中断を解除する。
【0165】
このようなイヤホン12で操作ができると、携帯端末11を取り出す手間等を省ける。
【0166】
なお、図示するように、第200出力EX200が省略されてもよい。この例では、音声認識システム1は、中断が行われた第1時点より、前の時点である第21出力EX21が開始される時点(以下「第2時点」という。)から出力音声を出力する。なお、第2時点は、事前に設定される、又は、第1時点で出力されていた出力音声の最初の時点等である。このように、出力音声が言い直しされる構成でもよい。
【0167】
また、中断及び解除は、例えば、所定のボタンを押している間、中断し、ボタンが押されるのが終わると解除するといったように、ボタン等で実現してもよい。
【0168】
他にも、中断及び解除は、携帯端末11等による所定の動作の開始及び終了に連動してもよい。例えば、携帯端末11に電話がかかってきたのを感知すると、音声認識システム1は、第2音声SD2の出力を中断する。なお、所定の動作は、事前に設定される。また、所定の動作は、外部装置による動作であってもよい。
【0169】
<音声入力及び音声出力の変形例>
図21は、音声入力及び音声出力の変形例を示す図である。以下、図示するように音声で「12.3」という数値(以下「対象数値20」という。)を扱う場合を例に説明する。
【0170】
第1音声SD1、すなわち、入力では、対象数値20は、1桁ずつ入力されるのが望ましい。具体的には、図示するように、第1音声SD1となる発音21は、対象数値20を分解して、「いち」、「に」、「てん」、及び、「さん」というように、1桁ずつ読み上げられるのが望ましい。
【0171】
第2音声SD2、すなわち、出力では、対象数値20は、数値全体を表現するように出力されるのが望ましい。具体的には、図示するように、第2音声SD2となるデータ音声22は、対象数値20の全体を表現して「じゅうにてんさん」というように、数値全体が表現されるように出力されるのが望ましい。
【0172】
発音21のように、1桁ずつ読み上げられる音声であると、音声認識を精度良く行うことができる。一方で、データ音声22が、数値全体を表現すると、ユーザ13は、1桁ずつ出力されるより、数値を音声で理解しやすい。
【0173】
<オフラインで音声認識を行う変形例>
オフラインの環境であっても、入力された音声を音声認識できる構成が望ましい。
【0174】
建築・保守現場は、通信環境によってインターネットにつながりにくい環境である場合も多い。そのため、常時クラウドを用いるのが困難な場合も多い。ゆえに、常時、クラウドにある音声認識エンジンを用いる構成であると、作業現場で音声認識等が実行できない場合がある。このような事態を避けるため、携帯端末11内で動作する音声認識エンジンを用いる構成が望ましい。特に、定型であって、短い言葉は、携帯端末11内で動作する音声認識エンジンで音声認識される構成が望ましい。
【0175】
このような構成であると、オフラインでも音声認識システム1を用いることができる。ゆえに、インターネットにつながりにくい環境であっても、音声認識システム1を用いて音声を入力することができる。
【0176】
さらに、ユーザ13によるコメント等といった非定型な音声入力は、携帯端末11が録音する構成であるのが望ましい。そして、事務所等といったインターネットにつながる環境下において、携帯端末11は、録音済みの音声をクラウド上の音声認識エンジンに送信してテキスト化する構成が望ましい。
【0177】
このように、オフラインで使用できる音声認識エンジンと、オンラインで使用できる音声認識エンジンを使い分ける構成が望ましい。
【0178】
また、音声認識エンジンの使い分けは、通信環境を考慮して切り替えられてもよい。具体的には、携帯端末11は、電波強度を計測して通信環境の良し悪しを判断する。なお、通信環境良し悪しは、現場ごとにあらかじめ登録又は以前の判断結果等が記憶されてもよい。このように、通信環境を考慮する構成であると、クラウド上の音声認識エンジンが使用できないといったトラブルを防ぐことができる。
【0179】
また、上記のようにオフライン等で録音を行うため、携帯端末11は、入力した音声データを録音し、録音データを生成及び録音データを記憶できる記憶部及び録音データ生成部を有する構成であるのが望ましい。
【0180】
なお、記憶部及び録音データ生成部は、オフラインに用いられるに限られない。すなわち、記憶部及び録音データ生成部は、クラウド上の音声認識エンジンが使用できる環境であっても、録音データを生成及び録音データを記憶してもよい。
【0181】
通信は、突然切断される場合もあるため、クラウド上の音声認識エンジンが使用できる場合であっても、録音できる構成が望ましい。このような構成であると、バックアップを行うことができる。
【0182】
<その他の実施形態>
実施形態は、上記の例に限られない。例えば、装置の数は、上記の例に示す台数に限られない。したがって、上記の例における各装置は、2台以上のシステムであってもよい。一方で、装置は、1台の構成でもよい。また、情報処理装置の種類及び組み合わせも、上記に示す装置でなくともよい。
【0183】
実施形態は、上記の処理に限られない。例えば、本発明に係る音声認識方法は、上記に説明した以外の順序で行われてもよい。また、音声認識方法は、複数の情報処理装置で実行されてもよい。つまり、音声認識方法における各ステップは、冗長、分散、並列、仮想化又はこれらの組み合わせで実行されてもよい。
【0184】
実施形態は、プログラムによって実現されてもよい。すなわち、情報処理装置等のコンピュータは、プログラムに基づいて、演算装置及び記憶装置等を制御して、上記の方法を実行してもよい。また、プログラムは、コンピュータが読み取り可能な記録媒体に記録されて頒布することができる。なお、記録媒体は、磁気テープ、フラッシュメモリ、光ディスク、光磁気ディスク又は磁気ディスク等のメディアである。さらに、プログラムは、電気通信回線を通じて頒布することができる。
【0185】
なお、上記に示す実施形態の構成等に、その他の要素との組み合わせ等、上記の構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0186】
1 音声認識システム
1F100 中断手段
1F101 解除手段
1F11 音声入力手段
1F12 音声認識手段
1F13 登録手段
1F14 出力手段
1F15 制限手段
1F16 入力データ生成手段
1F17 記憶手段
1F18 判断手段
1F19 ノイズキャンセル手段
1F20 グループ設定手段
1F21 省略操作手段
10 サーバ
11 携帯端末
12 イヤホン
13 ユーザ
20 対象数値
21 発音
22 データ音声
C1 中断操作
C2 解除操作
C3 省略操作
C11 中断音声
C12 第1操作
C21 解除音声
C22 第2操作
D211 第1辞書
D212 第2辞書
EX11 第11出力
EX12 第12出力
EX13 第13出力
EX21 第21出力
EX22 第22出力
EX23 第23出力
EX31 第31出力
EX32 第32出力
EX200 第200出力
FR1 第1周波数帯域
FR2 第2周波数帯域
GS グループ
MEM 記憶領域
NW ネットワーク
NZ1 第1ノイズ
NZ2 第2ノイズ
NZ3 第3ノイズ
PR1 制限処理
PR2 中断処理
PR3 省略処理
SD1 第1音声
SD2 第2音声
V10 第1入力データ
V21 前回結果
V22 許容範囲
V23 正常値
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21