(58)【調査した分野】(Int.Cl.,DB名)
前記音声認識手段は、前記第2の記憶手段に登録された指令語と前記第2の変換手段で変換された音素の列との一致度を算出し、所定の閾値以上の一致度を有し、かつ、一致度が最も高い指令語を前記話者が発声した音声指令と認識する、請求項1に記載の音声指令入力装置。
前記話者の発声した音素に応じた口の動きのデータは、前記話者が音声を発声しない表情を基準として音声を発声したときの表情の変化に基づく前記加速度センサの変位ベクトルのデータである、請求項1又は2に記載の音声指令入力装置。
前記加速度センサは、互いに直交する3軸方向の加速度を検出する三軸加速度センサであり、前記話者の両頬もしくは口元の両側にそれぞれ取り付けられている、請求項1乃至3のいずれかに記載の音声指令入力装置。
【発明を実施するための形態】
【0032】
以下、本発明に係る音声指令入力装置と、その音声指令入力装置を備えた溶接システムの実施の形態について、図面を参照して説明する。
【0033】
まず、音声指令入力装置について説明する。
【0034】
図1は、本発明に係る音声指令入力装置の構成を示すブロック図である。
図2は、同音声指令入力装置に用いられる加速度センサの外観を示す外観図である。
【0035】
音声指令入力装置1は、加速度センサ101、座標変換部102、変換テーブル記憶部103、音声変換部104、音声認識部105、言語モデル記憶部106、指令信号変換部107及び指令語記憶部108を含む。
【0036】
加速度センサ101は、音声指令を発する話者(作業者)Qの頬や口元の周辺部に取り付けられ、口角を動かす頬筋や口元の表情を作る口輪筋などの動きを検出するためのセンサである。座標変換部102、変換テーブル記憶部103、音声変換部104、音声認識部105、言語モデル記憶部106、指令信号変換部107及び指令語記憶部108は、音声指令入力装置1の装置本体100内に設けられる。
【0037】
加速度センサ101及び座標変換部102は、本発明に係る「検出手段」に対応し、座標変換部102は、本発明に係る「第1の変換手段」に対応している。また、変換テーブル記憶部103、音声変換部104、音声認識部105及び言語モデル記憶部106は、本発明に係る「指令語変換手段」に対応し、変換テーブル記憶部103と言語モデル記憶部106は、本発明に係る「第1の記憶手段」と「第2の記憶手段」とにそれぞれ対応している。また、音声変換部104と音声認識部105は、本発明に係る「第2の変換手段」と「音声認識手段」とにそれぞれ対応している。
【0038】
また、指令信号変換部107及び指令語記憶部108は、本発明に係る「指令信号生成手段」に対応し、指令信号変換部107は、本発明に係る「第3の変換手段」に対応し、指令語記憶部108は、本発明に係る「第3の記憶手段」に対応している。
【0039】
加速度センサ101は、話者Qの頭部に装着されるケーブル中継部材2を介して装置本体100内の座標変換部102に接続されている。ケーブル中継部材2は、円弧型に湾曲した弾性を有する頭部装着部201と、頭部装着部201の両端に設けられた加速度センサ101との接続部202と、一方端が接続部202に接続され、頭部装着部201のほぼ中央から引き出された他方端が装置本体100に接続される信号線203と、を有する。
【0040】
加速度センサ101からはフレキシブルなリード線1011が引き出され、そのリード線1011の先端には接続部202に電気的に接続するためのコネクタ1012が設けられている。加速度センサ101のコネクタ1012をケーブル中継部材2の接続部202に接続することにより、加速度センサ101は、リード線1011及び信号線203によって装置本体100内の座標変換部102に電気的に接続される。加速度センサ101の検出信号は、リード線1011及び信号線203を介して座標変換部102に入力される。
【0041】
加速度センサ101には、
図2に示すように、数mm径の円盤状を有する小型・軽量の半導体式加速度センサが用いられている。半導体式加速度センサは、例えば、MEMS(Micro Electro Mechanical Systems)技術を用いたものが好適である。
【0042】
半導体式加速度センサ101は、加速度を検出するセンサチップと、センサチップから出力される検出信号に所定の信号処理を行って外部に出力する信号処理回路を含む。加速度検出方式には静電容量型、ピエゾ抵抗型、ガス温度分布型、動電型、磁気型などの各種のタイプがあるが、いずれのタイプのセンサチップを用いてもよい。
【0043】
加速度センサには、一般に、XYZ直交座標系(
図2参照)の各軸方向(3方向)の加速度を検出する3軸加速度センサ、2方向(XY方向)の加速度を検出する2軸加速度センサ、1方向(X方向)の加速度を検出する1軸加速度センサがある。加速度センサ101は、好ましくは2軸加速度センサ又は3軸加速度センサを用いるとよい。
【0044】
加速度センサ101は、話者Qの両頬若しくは口元の両側の近傍に1対取り付けるのが好ましいが、2対以上取り付けてもよく、話者Qの一方の頬若しくは口元の一方側の近傍に1個取り付けてもよい。
【0045】
加速度センサ101は、例えば、シート状の接着部材3によって話者Qの頬若しくは口元の周辺部に接着されている。接着部材3には、皮膚への密着性や接着強度などを考慮して、例えば、医療用テープや皮膚貼付用テープ等を用いるとよい。
図1の例では、加速度センサ101に接着部材3を直接接着しているが、加速度センサ101と接着部材3との間に、話者Qが口を動かしたときの皮膚の振動を吸収するための緩衝部材を介在させるようにしてもよい。
【0046】
図1の例では、話者Qの口元の両側の近傍にそれぞれ加速度センサ101Rと加速度センサ101L(Rは、話者Qの顔の右側にあるセンサを示し、Lは、話者Qの顔の左側にあるセンサを示す。)が取り付けられている。また、加速度センサ101R,101Lは、3軸加速度センサである。話者Qの口元の両側に一対の3軸加速度センサ101R,101Lを設けることにより、両加速度センサ101R,101Lの検出信号Sx,Sy,Szを用いて話者Qが音声を発したときの口元の微妙な動きを検出することができる。
【0047】
図3は、話者Qの顔に加速度センサ101を取り付けた場合の当該加速度センサ101の加速度の検出方向を示す図である。
【0048】
3軸の加速度センサ101には、当該加速度センサ101に対して互いに直交するXYZ座標系が仮想設定されており、加速度センサ101からはそのXYZ座標系のX軸、Y軸、Z軸の各軸方向の加速度を検出した検出信号Sx,Sy,Szが出力される。
【0049】
加速度センサ101は、当該加速度センサ101に仮想設定されるXYZ座標系のX軸方向とY軸方向を話者Qの顔の横方向(左右方向)と縦方向(上下方向)にそれぞれ一致させて話者Qの顔の頬若しくは口元の周辺部に取り付けられる。
【0050】
話者Qの顔の頬若しくは口元の周辺部に加速度センサ101が取り付けられると、
図3に示すように、加速度センサ101に仮想設定されているXYZ座標系は、話者Qの顔の加速度を計測する直交座標系となる。
【0051】
すなわち、話者Qの顔の加速度センサ101の取り付け位置がXYZ座標系の原点Oとなり、話者Qの顔の表面(通常、曲面)の原点Oにおける横方向の接線がX軸方向となり、縦方向の接線がY軸方向となる。また、話者Qの顔の表面の原点Oにおける法線方向がZ軸方向となる。
【0052】
話者Qが頬筋や口輪筋を動かしていない顔の表情を基準表情とすると、その基準表情におけるXYZ座標系の原点Oの位置は話者Qの頬や口角の動きを検出する検出位置Prとなる。話者Qが頬筋や口輪筋を動かして顔の表情を変化させると、その変化に応じて加速度センサ101が変位し、話者Qの顔に取り付けられた加速度センサ101から話者Qの顔の横方向の加速度を検出した検出信号Sxと、話者Qの顔の縦方向の加速度を検出した検出信号Syと、話者Qの顔の法線方向の加速度を検出した検出信号Szが出力される。
【0053】
加速度センサ101が変位すると、
図4に示すように、話者Qの頬や口角の動きを検出する検出位置Prが基準表情のときの位置(以下、この位置を「基準位置」という。)から変位する。検出位置Prの基準位置からの変位は変位ベクトルVによって表され、その変位ベクトルVのX軸、Y軸及びZ軸方向の各軸方向の成分Xd、Yd、Zdは、検出信号Sx,Sy,Szを用いてそれぞれ算出することができる。
【0054】
座標変換部102は、加速度センサ101から出力される検出信号Sx,Sy,Szを用いて、変位ベクトルVのX軸方向、Y軸方向及びZ軸方向の座標Xd、Yd、Zdに変換する。座標変換部102は、所定の周期で加速度センサ101から検出信号Sx,Sy,Szを取り込み、検出信号毎に積分処理を2回行って各軸方向の距離、すなわち、検出位置Prが基準位置から変位した位置Pd(以下、「変位位置Pd」という。)の座標Xd、Yd、Zdを算出する。
【0055】
変換テーブル記憶部103は、座標変換部102が算出した変位位置Pdの座標Xd、Yd、Zdを、「あ」、「い」、「う」、…「ん」の音素のデータに変換するための変換テーブルを格納している。音素のデータは、例えば、周知の文字コード表における音素に対応する文字(ひらかな又はカタカナ)のコードデータである。
【0056】
話者Qが「あ」、「い」、「う」等の音素を発声するとき、話者Qの口の形は、発生する音素によって異なる。例えば、「あ」、「い」、「う」の母音を発声する場合、口の形は、通常、
図5の(a)〜(c)に示すようになる。
【0057】
すなわち、「あ」を発声するときの口の形は、上唇と下唇を上下に大きく開けた形となり(
図5(a))、「い」を発声するときの口の形は、上唇と下唇を上下に少し開いた状態で口角を横に引っ張る形となり(
図5(b))、「う」を発声するときの口の形は、唇を突き出すように口を窄めた形となる(
図5(c))。
【0058】
音素によって話者Qの口の形が異なるので、話者Qが言葉を発するとき、各音素の発声時の話者Qの頬若しくは口元の周辺部に取り付けた加速度センサ101の位置(検出位置Pr)の動き(変位量)が異なる。例えば、加速度センサ101が話者Qの口角の真横に取り付けられている場合、例えば、「あ」を発声したときの検出位置Prの変位ベクトルVは、X方向とY方向の変位量は小さく、Z方向の変位量がX方向,Y方向の変位量に対して大きくなる傾向がある。一方、「い」を発声したときの検出位置Prの変位ベクトルVは、Y方向の変位量は小さく、Y方向の変位量がX方向の変位量に対して大きくなる傾向がある。
【0059】
このように、話者Qが音素を発声したときの検出位置Prの変位ベクトルVは、各音素に応じた特徴的な変化をするので、変換テーブル記憶部103には、検出位置Prの変位ベクトルV(変位位置Pdの座標)と音素のデータとの対応関係を示すデータが変換テーブルとして記憶されている。この変換テーブルは、本発明に係る「第1の変換テーブル」に対応するものである。
【0060】
変換テーブルの音素に対応する変位ベクトルV(X,Y,Z)には、例えば、予め音声指令入力装置1を使用する話者Qに「あ」、「い」、「う」等の音素を発声させて取得した変位ベクトルV(X,Y,Z)の実測値が用いられる。多数の話者Qに音素を発声させて変位ベクトルV(X,Y,Z)を計測し、その計測値に基づいて算出した代表的な変位ベクトルV(X,Y,Z)を、変換テーブルの音素に対応する変位ベクトルV(X,Y,Z)に用いてもよい。代表的な変位ベクトルV(X,Y,Z)は、例えば、n人の変位ベクトルの計測値(X
m,Y
m,Z
m)の平均値(ΣX
m/n,ΣY
m/n,ΣZ
m/n)によって定義することができる。
【0061】
図6は、変換テーブル記憶部103に記憶されている変換テーブルの一例を示す図である。
【0062】
変換テーブルは、「あ」、「い」、…「ん」の各音素のデータと、予め取得された変位ベクトルVi(Xi,Yi,Zi)(iは、音素を区別するための便宜上の符合。i=1,2,…)との対応関係を示すデータである。
図6の表では、音素の欄に、音素に対応する「ひらがな」の文字を記載しているが、変換テーブルでは「ひらかな」又は「カタカナ」の文字コード表におけるコードデータが記載されている。
【0063】
図6に示す変換テーブルには、50音の音素について、変位位置Pdの座標Xd、Yd、Zdを音素の文字コードに変換するデータが含まれているが、音声認識の対象とならない音素については、変換データがなくてもよい。例えば、音声指令入力装置1を溶接システムに用いる場合、溶接システムの音声指令に登録される指令の言葉(以下、「指令語」という。)は限られており、その指令語に使用される音素も限られるので、音声の指令語に使用されない音素については、変換データがなくてもよい。
【0064】
例えば、溶接システムの音声指令に使用される用語が[かいし]、「ていし」、「でんりゅう」、「でんあつ」、「あげる」、「さげる」などの簡単な言葉で、例えば、「を」、「わ」などの音素が用いられない場合は、「を」、「わ」の音素については変換テーブルに変換データが含まれていなくてもよい。
【0065】
音声変換部104は、座標変換部102から出力される変位位置Pdの座標Xd、Yd、Zdを変換テーブル記憶部103に記憶された変換テーブルを参照して話者Qが発声した音声のデータ(音素の列を文字コードの列に変換したデータ)に変換する。
【0066】
例えば、座標変換部102から出力される変位位置Pdの座標Xd、Yd、Zdが(X1,Y1,Z1)を中心とした所定の誤差範囲(±ΔX,±ΔY,±ΔZ)内であれば、音声変換部104は、「あ」の音素(文字コード)に変換する。同様に、変位位置Pdの座標Xd、Yd、Zdが(X6,Y6,Z6)であれば、音声変換部104は、「か」の音素(文字コード)に変換する。従って、座標変換部102から(X1,Y1,Z1)と(X6,Y6,Z6)の座標データが順番に出力されると、音声変換部104は、「あ」と「か」の音素(文字コード)に順番に変換して出力する。
【0067】
音声認識部105は、音声変換部104から出力される文字列を言語モデル記憶部106に記憶されている言語モデルを用いて認識する処理(話者Qが発声した音声の認識処理)を行う。言語モデル記憶部106は、音声認識処理における周知の言語モデルを記憶する。言語モデルとは、日本語言語における文の品詞、統語構造、単語同士の関係性などを定式化したものである。
【0068】
音声認識部105は、例えば、音声変換部104から入力される文字コードの列が「よ」、「う」、「せ」、「つ」、「か」、「い」、「し」の場合、音声認識部105は、「ようせつ」+「かいし」=「溶接 開始」と認識する処理を行う。
【0069】
指令信号変換部107は、音声認識部105から出力される音声認識の結果を指令語記憶部108に記憶されている指令語を用いて指令信号に変換する処理を行う。指令語記憶部108は、音声指令として登録された指令語と指令信号との対応関係を示す変換テーブルを記憶する。この変換テーブルは、本発明に係る「第2の変換テーブル」に対応するものである。
【0070】
指令信号は、例えば、制御部にアクチュエータの動作の制御を行わせるために当該制御部に入力する電気信号である。例えば、操作部に「動作開始」の操作ボタンが設けられ、その操作ボタンが操作されたときに制御部に「動作開始」に対応する所定の指令信号Scが入力される構成の場合、「動作開始」の指令語には「指令信号Sc」の指令信号が対応付けられる。
【0071】
従って、指令信号変換部107は、音声認識部105から出力される音声認識の結果が「動作開始」の指令語の場合、指令語記憶部108に記憶された指令語を指令信号に変換するための変換テーブルを用いてその指令語に対応する指令信号Scを生成して出力する。
【0072】
上記のように、本実施の形態に係る音声指令入力装置1によれば、話者(作業者)Qの頬若しくは口元の周辺部に加速度センサ101を取り付け、話者Qが音声指令を発声したときの加速度センサ101の検出信号Sx,Sy,Szを用いて話者Qの口の動きを検出し、その動きから話者Qが発声した音声指令を認識するようにしているので、例えば、話者Qの発声した音声指令をマイクで集音し、その集音した音声信号を用いて音声を認識する場合に比べて話者Qの周囲で発生する雑音や騒音の影響を殆ど受けることがなく、高い精度で音声指令を認識して当該音声指令に対応する指令信号を出力させることができる。
【0073】
次に、本実施の形態に係る音声指令入力装置1の応用例として、音声による操作指令が入力可能な溶接システムについて説明する。
【0074】
図7は、音声指令入力装置1を備える溶接システムの構成を示すブロック図である。
【0075】
図7に示す溶接システム4は、音声による操作指令が入力可能な消耗電極式の半自動アーク溶接システムである。溶接システム4は、溶接電源装置5、ワイヤ送給装置6、溶接トーチ7、ガス供給装置8及びワイヤリール9を含み、ワイヤ送給装置6には音声により操作指令を入力するための上述した音声指令入力装置1が設けられている。
【0076】
溶接電源装置5は、溶接ワイヤWと母材Bとの間に供給する電力(溶接用電力)と、ワイヤ送給装置6のワイヤ送給機構601に供給する電力(ワイヤ送給用電力)を生成し、ワイヤ送給装置6を介して溶接用電力を溶接トーチ7に供給するとともに、ワイヤ送給用電力をワイヤ送給装置6のワイヤ送給機構601に供給する機能を有する。
【0077】
溶接電源装置5は、機能ブロックとして、電源部501、制御部502、操作部503及びは表示部504を含む。電源部501、操作部503及び表示部504は、制御部502に接続されている。
【0078】
電源部501は、溶接電源装置5の駆動電力を生成するとともに、ワイヤ送給装置6の駆動電力と溶接用電力を生成する。ワイヤ送給装置6の駆動電力は、主として制御部603や表示部605などを駆動するための電力と溶接作業中に溶接ワイヤWを溶接トーチ7に送給するための駆動電力である。溶接用電力は、主として溶接ワイヤWと母材Bとの間にアークAを発生させるための電力とアーク発生後の溶接作業用の電力である。
【0079】
電源部501の電力発生動作は、制御部502によって制御される。ワイヤ送給装置6は、パワーケーブル(図示省略)と制御ケーブル(図示省略)とによって溶接電源装置5に接続される。溶接電源装置5の電源部501で生成されたワイヤ送給装置6の駆動電力と溶接トーチ7への溶接用電力は、パワーケーブルでワイヤ送給装置6に供給され、溶接用電力は、更にワイヤ送給装置6を介して溶接ワイヤWと母材Bとの間に供給される。溶接電源装置5の制御部502とワイヤ送給装置6の制御部603との間のデータ通信は、制御ケーブルを介して行われる。
【0080】
電源部501は、溶接用電力を生成する溶接用電源5011と溶接ワイヤ送給用の電力を生成するワイヤ送給用電源5012とを有する。溶接用電源5011は、三相交流の商用電源Pから制御部502の制御指令に基づく所定の溶接用直流電力又は溶接用交流電力を生成する。溶接用電力は、溶接中の作業者の操作指令や予め設定されたプログラムに基づいて変化する。
【0081】
ワイヤ送給用電源5012は、例えば、ワイヤ送給装置6のワイヤ送給機構601が直流モータで溶接ワイヤWを送給する場合、商用電源Pから直流電力を生成する周知の直流電源で構成されている。ワイヤ送給用電源5012は、商用電源Pから直流電力を生成し、ワイヤ送給機構601に規定されている駆動電圧でパワーケーブルを介してワイヤ送給装置6に出力する。
【0082】
電源部501は、電力の発生動作に同期してガス供給装置8からシールドガスを溶接トーチ7に供給する制御を行う。電源部501は、制御ケーブルによってワイヤ送給装置6内のガス電磁弁602に接続されている。電源部501は、電力の生成の開始に同期してガス電磁弁602を「開」状態に制御し、電力の生成の停止に同期してガス電磁弁602を「閉」状態に制御する。
【0083】
制御部502は、操作部503による情報の入力、表示部504よる情報の出力、電源部501によるワイヤ送給装置6への電源供給などの各処理を統括的に制御する。
【0084】
制御部502は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)及びMPU(Micro−Processing Unit)を有するマイクロコンピュータで実現されている。なお、制御部502は、FPGA(Field−Programmable Gate Array)などのPLD(Programmable Logic Device)で実現してもよい。
【0085】
操作部503は、作業者がアーク溶接に関する各種の情報を制御部502に入力する操作を行うブロックである。操作部503は、例えば、溶接電源装置5の筐体面に配設された操作パネルに設けられている。作業者が操作する操作部材は、例えば、操作パネルに所定の項目毎に配設された1又は2以上の操作ボタンや電源スイッチなどで構成される。なお、操作部503は、タッチパネルやキーボードなどの他の種類の入力装置で構成してもよい。
【0086】
作業者が操作部503の操作ボタンを操作すると、その操作ボタンに対応する所定の指令信号が制御部502に入力される。
【0087】
作業者が操作部503から入力するアーク溶接に関する情報は、例えば、スタート方式や交流/直流の溶接方式などの方式に関する情報や、初期電流、溶接電圧、溶接電流、交流波形(パルス波形や正弦波波形などの波形)、交流溶接における周波数などの溶接条件に関する情報などである。操作部503から制御部502に入力されるアーク溶接に関する情報は、一旦メモリ(RAM)に保存され、表示部504に転送される。
【0088】
表示部504は、アーク溶接に関する各種の情報を作業者が視認できるように表示する。表示部504は、例えば、LEDや7セグメントなどの表示機で構成される。表示部504は、液晶ディスプレイなどの表示装置で構成してもよい。表示部504は、制御部502から転送される情報を所定の表示態様で表示する。
【0089】
ワイヤ送給装置6は、機能ブロックとして、ワイヤ送給機構601、ガス電磁弁602、制御部603、操作部604、表示部605及び電圧/電流検出部606を含む。ワイヤ送給装置6には、上述した音声指令入力装置1が設けられている。操作部604、表示部605、電圧/電流検出部606及び音声指令入力装置1は、制御部603に接続されている。
【0090】
ワイヤ送給機構601は、溶接作業中に溶接ワイヤWが巻き付けられたワイヤリール9から当該溶接ワイヤWを繰り出して溶接トーチ7に連続的に供給するための機構である。ワイヤ送給機構601は、ワイヤリール9から溶接トーチ7まで溶接ワイヤWをガイドするガイド機構と溶接ワイヤWを繰り出す駆動源であるワイヤ送給モータとを有する。ワイヤ送給モータは、溶接電源装置5から供給されるワイヤ送給用電力によって駆動される。
【0091】
ガス電磁弁602は、ガス供給装置8から溶接トーチ7へのシールドガスの供給を制御するための弁である。シールドガスは、溶接面を空気から遮断するためのアルゴン(Ar)、ヘリウム(He)といった不活性ガスである。シールドガスは、ガス供給装置8に封入されており、作業者が溶接作業を開始する際にガス供給装置8の栓を開くことによって、所定の圧力で溶接トーチ7への供給が可能になる。
【0092】
ガス電磁弁602は、溶接開始から溶接終了までの期間に流路を開いてガス供給装置8から溶接トーチ7にシールドガスを供給する。ガス電磁弁602の開閉は、上述したように、溶接電源装置5の電源部501によって制御される。
【0093】
制御部603は、操作部604による情報の入力、表示部605による情報の出力、ワイヤ送給機構601による溶接ワイヤWの送給などの各処理を統括的に制御する。制御部603は、ROM、RAM及びMPUを有するマイクロコンピュータで実現されている。制御部603もFPGAなどのPLDで実現してもよい。
【0094】
操作部604は、ワイヤ送給装置6の筐体面に配設された操作パネルに設けられている。作業者が操作する操作部材は、例えば、操作パネルに所定の項目毎に配設された1又は2以上の操作ボタンや電源スイッチなどで構成される。なお、操作部604もタッチパネルなどの他の種類の入力装置で構成してもよい。
【0095】
作業者が操作部604の操作ボタンを操作すると、その操作ボタンに対応する所定の指令信号が制御部603に入力される。
【0096】
作業者が操作部604によって入力するアーク溶接に関する情報は、基本的に、作業者が操作部503によって溶接電源装置5の制御部502に入力する情報と同じである。操作部604から制御部603に入力されるアーク溶接に関する情報は、一旦メモリ(RAM)に保存され、表示部605に転送される。
【0097】
溶接トーチ7は、ワイヤ送給機構601で送給される溶接ワイヤWを保持するとともに、ガス供給装置8からガス電磁弁602を介して供給されるシールドガスを当該シールドガスが溶接ワイヤWと母材Bとの間に発生するアークAと溶接金属を覆うように出力する機能を果たす機器である。溶接トーチ7には、作業者が手元で溶接電流を調整するためのトーチスイッチ701が設けられている。
【0098】
トーチスイッチ701は、制御ケーブル(図示省略)でワイヤ送給装置6の制御部603に接続されている。トーチスイッチ701は、例えば、押しボタン式のモーメンタリー・スイッチで構成される。制御部603には、例えば、トーチスイッチ701が「ON」になると、ハイレベルの信号が入力され、トーチスイッチ701が「OFF」になると、ローレベルの信号が入力される。
【0099】
作業者は、トーチスイッチ701をONにした後、所定の時間tが経過してOFFにする操作をすることにより、制御部603にパルス幅tのパルス信号を入力することができる。制御部603には、トーチスイッチ701から入力されるパルス信号の波形を特定の操作指令に変換するテーブルが設けられている。
【0100】
例えば、制御部603には、パルス幅tが所定の時間よりも大きいパルス信号となるクリック操作を溶接電流の通電又は遮断を行う操作指令に割り当て、パルス幅tが所定の時間以内のパルス信号となるシングルクリック操作を所定のステップで溶接電流を減少させる指令信号に割り当て、同パルス信号が所定の時間間隔内で連続して2回発生させるダブルクリック操作を所定のステップで溶接電流を増加させる指令信号に割り当てたテーブルが設けられている。
【0101】
作業者は、トーチスイッチ701を所定の操作パターンで操作することにより、溶接作業の開始、溶接中の溶接電流の変更、溶接作業の終了などの指令を制御部603に入力することができる。制御部603は、操作部604から指令信号が入力されると、その指令信号を溶接電源装置5の制御部502に送信する。
【0102】
本実施の形態では、トーチスイッチ701をワイヤ送給装置6の制御部603に接続しているが、トーチスイッチ701を溶接電源装置5の制御部502に接続し、トーチスイッチ701の操作信号を制御部502に直接入力するようにしてもよい。
【0103】
電圧/電流検出部606は、溶接ワイヤWと母材Bとの間の電圧(溶接電圧)と溶接ワイヤWと母材Bとの間に流れる電流(溶接電流)を検出する。電圧/電流検出部606は、電圧を検出する電圧センサと、その電圧センサから出力される電圧検出値をデジタル信号に変換して制御部603に出力する。また、電圧/電流検出部606は、電流を検出する電流センサと、その電流センサから出力される電流検出値をデジタル信号に変換して制御部603に出力する。
【0104】
制御部603には、操作部604若しくはトーチスイッチ701から作業者によって入力されたアーク溶接に関する情報と、電圧/電流検出部606から溶接作業中の溶接電圧検出値と溶接電流検出値に関する情報が入力される。制御部603に入力されるこれらの情報は、制御ケーブルを介してデータ通信によりワイヤ送給装置6から溶接電源装置5に送信される。
【0105】
表示部605は、例えば、LEDや7セグメントなどの表示機で構成される。表示部605は、液晶ディスプレイなどの表示装置で構成されてもよい。表示部605は、制御部603から転送される情報に基づいて、所定の表示をする。
【0106】
音声指令入力装置1は、
図1に示した音声指令入力装置1の装置本体100内に設けられる座標変換部102、変換テーブル記憶部103、音声変換部104、音声認識部105、言語モデル記憶部106、指令信号変換部107及び指令語記憶部108がワイヤ送給装置6内に設けられ、音声指令入力装置1の加速度センサ101は、作業者Qの頬若しくは口元の周辺部に取り付けられている。
図7では、音声指令入力装置1の装置本体100内に設けられる部分を音声指令入力部109で示している。
【0107】
ワイヤ送給装置6では、作業者は、操作指令を操作部604と音声指令入力装置1のいずれかで入力することができる。このため、ワイヤ送給装置6の操作パネルには、操作指令を入力する装置を選択するための選択ボタンが設けられている。この選択ボタンは、例えば、モーメンタリー・スイッチで構成され、作業者がモーメンタリー・スイッチをオン状態にしている期間に音声指令入力装置1を用いて音声により操作指令を制御部603に入力することができる。
【0108】
音声指令入力装置1における加速度センサ101及び座標変換部102については、上述した通りであるから、以下では、音声変換部104〜指令語記憶部108について説明する。
【0109】
溶接システム4で音声指令に使用される単語は、50音の中の一部であるから、音声指令で使用される音素について、予め変換テーブルが作成され、変換テーブル記憶部103に記憶されている。例えば、音声指令に登録されている用語が「でんりゅう」、「でんあつ」、「あげる」、「さげる」、「ようせつ」、「かいし」、「ていし」などの場合、「て/で」、「ん」、「りゅ」、「う」、「つ」、「あ」、「け/げ」、「る」、「か」、「さ」、「よ」、「せ」、「い」、「し」などの音素に対する変換テーブルが変換テーブル記憶部103に記憶されている。
【0110】
音声変換部104は、座標変換部102から入力される変位位置Pdの座標(Xd,Yd,Zd)の列を変換テーブル記憶部103に記憶された変換テーブルを参照して作業者Qが発声した音声のデータ(音素の列を文字コードの列に変換したデータ)に変換する。
【0111】
音声変換部104は、例えば、座標(Xd,Yd,Zd)が(X19±ΔX,Y19±ΔY,Z19±ΔZ)(
図6参照)であれば、「て」の音素(文字コード)に変換する。しかし、座標(Xd,Yd,Zd)が変換テーブル記憶部103に記憶されていない場合は、音声変換部104は、例えば、「?」などの文字でない記号のコードに変換する。
【0112】
例えば、座標変換部102から音声変換部104に、(X19±ΔX,Y19±ΔY,Z19±ΔZ)、(X2±ΔX,Y2±ΔY,Z2±ΔZ)、(X12±ΔX,Y12±ΔY,Z12±ΔZ)(
図6参照)の座標のデータが順番に入力された場合、これらの座標を音素に変換する変換データは存在するので、音声変換部104は、「て」、「い」、「し」の音素に順番に変換して出力する。
【0113】
しかし、音声変換部104に2番目に入力された座標のデータが変換テーブル記憶部103に記憶されていない音素、例えば、「い」の口の形に似ている「に」の音素の場合、音声変換部104は、「て」、「?」、「し」の音素に順番に変換して出力する。
【0114】
音声認識部105は、音声変換部104から入力される文字コードの列を言語モデル記憶部106に記憶されている言語モデルを用いて音声を認識する処理を行う。言語モデル記憶部106には、溶接システムにおける指令語で使用される用語や単語のデータが記憶されている。
【0115】
図8は、言語モデル記憶部106に記憶されている指令語に使用される用語や単語のデータの一例を示す図である。
【0116】
図8に示すように、言語モデル記憶部106には、「溶接」、「電圧」、「電流」、「上げる」、「下げる」、「開始」、「停止」、「高い」、「低い」、「有り」、「無し」などの溶接作業での指令に使用される用語や単語が登録されている。
【0117】
なお、言語モデル記憶部106には、ひらがな又はカタカナで2文字以上の溶接用の用語や単語が登録されるが、1文字の用語や単語が登録されていてもよい。以下の説明では、説明の便宜上、言語モデル記憶部106には2文字以上の溶接用の用語や単語が登録されるものとする。
【0118】
また、指令に使用される用語や単語に同音異義語の用語や単語が含まれる場合、文字列が異なるように、一方の用語を同意語や類義語に変更して言語モデル記憶部106に登録されているものとする。例えば、指令に使用される用語に「加工(かこう)」と「下降(かこう)」の用語が含まれる場合、「下降(かこう)」の用語は「降下(こうか)」の用語に変更して言語モデル記憶部106に登録される。これにより、言語モデル記憶部106には、指令に使用される用語や単語が、可能な限り同音異義語の用語が含まれないように登録されている。
【0119】
音声認識部105は、音声変換部104から入力される文字列(文字コードの列)と言語モデル記憶部106に記憶されている用語(以下、「登録用語」という。)とを照合して、文字列が完全に一致する用語を話者Qが発声した用語と認識する。例えば、音声変換部104から入力される文字列が「で」、「ん」、「あ」、「つ」で、言語モデル記憶部106に「電圧(でんあつ)」の用語が登録されている場合、音声認識部105は、「でんあつ」=「電圧」と認識する処理を行う。
【0120】
また、音声認識部105は、音声変換部104から入力される文字列が言語モデル記憶部106に記憶されている登録用語と完全に一致しない場合、文字列と同一文字数の用語について、文字列の一致度Eを算出し、その一致度Eを用いて音声認識処理を行う。
【0121】
本実施の形態では、例えば、音声変換部104から入力される文字列の文字数をn(整数)とし、その文字列の文字のうち登録用語の文字に一致している文字の数をr(1≦r≦n−1の整数)とすると、文字列の一致度Eは、E=r/n(<1)又はE=r×100/n(<100)[%]で定義している。例えば、音声変換部104から入力される文字列の文字数が4個で、4文字からなる登録用語と一致している文字の数が3個の場合、一致度Eは3/4=0.75または75[%]となる。
【0122】
音声認識部105は、同一文字数の登録用語が2以上ある場合、各登録用語について一致度Eを算出し、予め設定された閾値E
TH以上の一致度Eを有する登録用語の中で最も一致度Eが高い登録用語を認識対象の用語に選出する。
【0123】
閾値E
THは、0.5<E
TH<1.0の範囲で任意に設定することができるが、本実施の形態では、例えば、文字数nが奇数の登録用語に対しては閾値E
TH1=2/3≒0.67を設定し、文字数nが偶数の登録用語に対しては閾値E
TH2=3/4=0.75を設定している。
【0124】
文字数nが奇数の登録用語に対する閾値E
TH1=2/3は、3文字の登録用語で過半数の文字(2文字)が一致する場合の一致度Eに相当している。3文字の登録用語の場合は、2/3以上の一致度Eを有する場合は2文字が一致する場合しかないので、音声変換部104から入力される3文字の文字列のうち2文字が一致した登録用語が認識対象の用語に選出されることになる。また、5文字の登録用語では、2/3以上の一致度Eを有する場合は4文字が一致する場合しかないので、音声変換部104から入力される5文字の文字列のうち4文字が一致した登録用語が認識対象の用語に選出されることになる。
【0125】
従って、音声認識部105は、音声変換部104から入力される文字列が3文字の場合は、文字列のうち2文字が一致した登録用語を話者Qが発声した用語と認識する。また、音声認識部105は、音声変換部104から入力される文字列が5文字の場合は、文字列のうち4文字が一致した登録用語を話者Qが発声した用語と認識する。
【0126】
7文字の登録用語では、2/3以上の一致度Eを有する登録用語は5文字又は6文字が一致する登録用語が認識対象の用語となるが、最も一致度Eの高いのは6文字が一致する登録用語である。従って、音声認識部105は、音声変換部104から入力される7文字の文字列のうち6文字が一致した登録用語があれば、その登録用語を話者Qが発声した用語と認識し、5文字が一致した登録用語しかない場合は、その登録用語を話者Qが発声した用語と認識する。
【0127】
音声認識部105は、9文字以上の登録用語の場合も、7文字の登録用語の場合と同様にして2/3以上の一致度Eを有する登録用語の中で最も一致度Eが高い登録用語を話者Qが発声した用語と認識する。
【0128】
例えば、音声認識部105に「で」、「ん」、「あ」、「つ」、「し」の文字列が入力された場合、言語モデル記憶部106には5文字の用語で2/3以上の一致度Eを有する登録用語が「でんあつち」=「電圧値」しか登録されていなければ、音声認識部105は、「でんあつし」の文字列を「電圧値」と認識する。すなわち、音声認識部105は、「でんあつし」の文字列の「し」は、「ち」の音素の誤変換とみなして「でんあつち(電圧値)」と認識する。
【0129】
また、認識対象の用語が複数ある場合は、音声認識部105は、その用語の前後の用語との関係を加味していずれか1の用語を話者Qが発声した用語と認識する。例えば、音声認識部105に「で」、「ん」、「りゅ」、「う」、「え」、「い」、「し」の文字列(「え」は誤変換された文字)が入力され、音声認識部105が「で」、「ん」、「りゅ」、「う」の文字列は「でんりゅう」=「電流」と認識し、「え」、「い」、「し」の文字列の認識対象として「かいし」=「開始」と「ていし」=「停止」を選出したとする。
【0130】
「開始」は、「電流」に対して意味が通じない指令語「電流開始」となる関係であるのに対し、「停止」は、「電流」に対して意味が通じる指令語「電流停止」となる関係であるので、音声認識部105は、「え」、「い」、「し」の文字列を「ていし」=「停止」と認識する。
【0131】
文字数nが偶数の登録用語に対する閾値E
TH2=3/4は、4文字の登録用語で過半数の文字(3文字)が一致する場合の一致度Eに相当している。
【0132】
2文字の登録用語は、過半数の文字が一致する場合は完全に一致する場合であり、この場合は音声認識が可能であるから、音声認識部105は、通常の音声認識処理を行う。一方、音声変換部104から入力される2文字の文字列のいずれか一方の文字が登録用語の文字に一致する場合又は2文字の文字列のいずれの文字も登録用語に一致しない場合は、一致度Eが閾値E
TH2=3/4以上の条件を満たさないので、正しい音声認識をすることはできない。従って、これらの場合は、音声認識部105は、認識不可の処理を行う。
【0133】
4文字の登録用語の場合は、3/4以上の一致度Eを有する場合は3文字が一致する場合しかないので、音声変換部104から入力される4文字の文字列のうち3文字が一致した登録用語が認識対象の用語に選出されることになる。また、6文字の登録用語では、3/4以上の一致度Eを有する場合は5文字が一致する場合しかないので、音声変換部104から入力される6文字の文字列のうち5文字が一致した登録用語が認識対象の用語に選出されることになる。
【0134】
従って、音声認識部105は、音声変換部104から入力される文字列が4文字の場合は、文字列のうち3文字が一致した登録用語を話者Qが発声した用語と認識する。また、音声認識部105は、音声変換部104から入力される文字列が6文字の場合は、文字列のうち5文字が一致した登録用語を話者Qが発声した用語と認識する。
【0135】
8文字の登録用語では、3/4以上の一致度Eを有する登録用語は6文字又は7文字が一致する登録用語が認識対象の用語となるが、最も一致度Eの高いのは7文字が一致する登録用語である。従って、音声認識部105は、音声変換部104から入力される8文字の文字列のうち7文字が一致した登録用語があれば、その登録用語を話者Qが発声した用語と認識し、6文字が一致した登録用語しかない場合は、その登録用語を話者Qが発声した用語と認識する。
【0136】
音声認識部105は、音声変換部104から入力される文字列が偶数の文字数の場合も上述した文字列が奇数の文字数の場合と同様の認識処理を行う。また、音声認識部105は、音声変換部104から入力される文字列に対して閾値E
TH以上の一致度Eを有する登録用語が無い場合は、認識不可の処理を行う。認識不可の処理は、例えば、音声認識部105から指令信号変換部107に認識結果を出力しない処理や指令信号に変換できない所定の認識結果のデータを指令信号変換部107に出力する処理である。
【0137】
例えば、認識不可の処理として音声認識部105から指令信号変換部107に認識結果を出力しない処理をした場合は、指令信号変換部107には認識した指令語のデータが入力されないので、指令信号変換部107は指令信号への変換処理をしない。また、認識不可の処理として音声認識部105から所定の認識結果のデータを指令信号変換部107に出力した場合は、第2の変換テーブルに所定の認識結果のデータに対応する指令信号のデータがないので、この場合も指令信号変換部107は実質的に指令信号への変換処理をしない。
【0138】
上記の例では、文字数が奇数の登録用語に対する閾値E
TH1と文字数が偶数の登録用語に対する閾値E
TH2を文字数に関係なくそれぞれ1個に固定しているが、登録用語の文字数に応じて閾値
THを異ならせるようにしてもよい。
【0139】
また、上記の例では、文認識対象の登録用語が複数ある場合、その登録用語の前後の用語との関係を加味していずれか1の登録用語を話者Qが発声した用語と認識するようにしているが、各登録用語の一致しない文字の誤変換を推定して話者Qが発声した用語を認識するようにしてもよい。
【0140】
例えば、音声認識部105が「え」、「い」、「し」の3文字の文字列の認識対象として「かいし」=「開始」と「ていし」=「停止」を選出した上記の例では、音声認識部105は、「えいし」の文字列と「かいし」、「ていし」の登録用語との一致しない文字「え」について誤変換を推定する処理をする。音声認識部105は、例えば、「え」、「か」、「て」の各文字の母音を抽出し、「か」、「て」の文字のうち、「え」の口の形に近い母音を有する文字「て」を選出する。
【0141】
音声認識部105は、「え」の文字が「て」の文字の誤変換と推定し、認識対象として選出した登録用語のうち、「ていし」=「停止」の登録用語を話者Qが発声した用語と認識する。
【0142】
指令信号変換部107は、音声認識部105から出力される音声認識の結果を指令信号に変換する処理を行う。指令語記憶部108は、溶接システムにおける音声指令として登録された指令語と指令信号との対応関係を示す変換テーブルを記憶する。指令信号変換部107は、指令語記憶部108に記憶されている変換テーブルを用いて、音声認識部105から出力される音声認識の結果を指令信号に変換して制御部603に入力する。
【0143】
音声指令は、操作部604の操作ボタン又はトーチスイッチ701によって制御部603に入力される複数の操作指令の一部に対応する指令である。音声指令は、特に、作業者が溶接作業中に溶接電源装置5に入力する必要性の高い操作指令が選定されている。また、溶接用の用語は、操作指令を構成する単語である。
【0144】
図9は、指令語記憶部108に登録されている溶接システムの指令語とその内容の一例を示す図である。
【0145】
図9に示すように、指令語記憶部108には、「溶接 開始」、「溶接 停止」、「電圧 上げる」、「電圧 下げる」、「電流 上げる」、「電流 上げる」…などの溶接作業での指令語が登録されている。例えば、「溶接 開始」又は「溶接 停止」の指令語は、溶接トーチ7と母材Bへの溶接電力(アーク発生用の電力と溶接用の電力)の供給開始又は供給停止を指示する指令語である。
【0146】
また、「電圧 上げる」又は「電圧 下げる」の指令語は、現在の溶接電圧値に対して予め設定された単位電圧値ΔV(例えば、0.1[V])で溶接電圧を増加させる又は減少させる指令である。また、「電流 上げる」又は「電流 下げる」の指令語は、現在の溶接電流値に対して予め設定された単位電流値ΔI(例えば、1.0[A])で溶接電流を増加させる又は減少させる指令である。
【0147】
指令信号変換部107は、例えば、音声認識部105から「溶接 開始」の認識結果が入力されると、「溶接開始」の指令に対応する指令信号を生成し、制御部603に入力する。また、指令信号変換部107は、例えば、音声認識部105から「電圧 上げる」又は「電圧 下げる」の認識結果が入力されると、「溶接電圧 増加」又は「溶接電圧 減少」の指令に対応する指令信号を生成し、制御部603に入力する。
【0148】
一方、指令信号変換部107は、音声認識部105から入力される認識結果に対応する指令語が指令語記憶部108の変換テーブルに含まれていなければ、認識結果に対応する指令信号がないので、指令信号への変化処理をしない。また、指令信号変換部107は、音声認識部105から認識不可の処理として認識結果が入力されない場合も指令信号への変化処理をしない。従って、これらの場合は、制御部603には指令信号は入力されない。
【0149】
作業者Qが発声した音声指令の認識ができなかった場合は、制御部603に指令信号が入力されないので、作業者Qは、制御部603に指令信号が入力されるまで、音声指令の発声動作を繰り返すことになる。
【0150】
制御部603は、指令信号変換部107から指令信号が入力されると、制御ケーブルを介してその指令信号を溶接電源装置5の制御部502に送信する。制御部502は、ワイヤ送給装置6の制御部603から指令信号が入力されると、その指令信号に対応した所定の処理を実行する。
【0151】
例えば、制御部502は、制御部603は、「溶接電流 増加」の指令信号が入力されると、電源部501の溶接用電源5011が出力している溶接電流を所定の電流値(例えば、1[A])だけ増加させる制御を行う。
【0152】
次に、音声指令入力装置1による音声指令の入力制御について、
図10のフローチャートを用いて説明する。
【0153】
以下の説明では、溶接作業中に作業者が操作部604の選択ボタンを操作してワイヤ送給装置6を音声指令の入力許可状態にし、音声指令入力装置1を用いて音声指令を制御部603に入力する場合について、説明する。また、溶接作業中に作業者が入力する音声指令として、溶接電流を所定の電流値だけ増加させる「溶接電流 増加」の音声指令を例に説明する。
【0154】
制御部603は、操作部604から音声指令の入力許可が入力されたか否かを監視している(S100のループ処理)。制御部603は、音声指令の入力許可が入力されていなければ(S100:N)、操作部604若しくはトーチスイッチ701により操作指令を入力する通常の入力状態を維持し、音声指令の入力許可が入力されると(S100:Y)、通常の入力状態を音声指令の入力許可状態に切り換え、ステップS101に移行して音声指令の入力処理を行う。
【0155】
ステップS101に移行すると、座標変換部102は、加速度センサ101から出力されるX軸、Y軸、Z軸の各軸方向の加速度の検出信号Sx,Sy,Szを受け付け、その検出信号Sx,Sy,Szを検出位置Prの変位した変位位置Pdの座標(Xd,Yd,Zd)に変換する。
【0156】
続いて、音声変換部104が座標変換部102から出力される座標(Xd,Yd,Zd)を変換テーブル記憶部103に記憶されている変換テーブルを参照して音素のデータ(文字コードのデータ)に変換する(S102)。
【0157】
続いて、音声認識部105が音声変換部104から出力される文字列のデータ(文字コードの列のデータ)に対して、言語モデル記憶部106に記憶されている言語モデルを用いて音声の認識処理を行い(S103)、その音声認識処理で指令語が認識できたか否かを判断する(S104)。
【0158】
音声認識部105は、音声変換部104から入力される文字列と言語モデル記憶部106に記憶されている登録用語とを照合して、文字列が完全に一致する登録用語があれば、その登録用語若しくは登録用語の組合せを話者Qが発声した指令語と認識し、その認識結果(指令語のデータ)を指令信号変換部107に出力して(S104:Y)、ステップS108に移行する。
【0159】
例えば、音声変換部104から出力される文字列が「で」、「ん」、「りゅ」、「う」、「あ」、「げ」、「る」の場合、言語モデル記憶部106に「でんりゅう」と「あげる」の登録用語が登録されていれば、音声認識部105は、その文字列を「でんりゅう」+「あげる」=「電流 上げる」の指令語と認識し、「電流 上げる」のデータを指令信号変換部107に出力して(S104:Y)、ステップS108に移行する。
【0160】
一方、音声変換部104から入力される文字列と完全に一致する登録用語が言語モデル記憶部106に記憶されていない場合(S104:N)、音声認識部105は、言語モデル記憶部106に記憶されている登録用語のうち、音声変換部104から入力される文字列と同一の文字数の登録用語について、一致度Eを算出する(S105)。
【0161】
そして、音声認識部105は、一致度Eを用いた音声認識処理を行い(S106)、その音声認識処理で指令語が認識できたか否かを判断する(S107)。
【0162】
すなわち、音声認識部105は、一致度Eを算出した各登録用語について、予め設定された閾値E
TH以上の一致度Eを有する登録用語の中で最も一致度Eが高い登録用語を話者Qが発声した指令語と認識し、その認識結果を指令信号変換部107に出力して(S107:Y)、ステップS108に移行する。
【0163】
また、音声認識部105は、閾値E
TH以上の一致度Eを有する登録用語の中で最も一致度Eが高い登録用語が2以上ある場合は、例えば、各登録用語の前後の認識された登録用語との関係を加味して1の登録用語を決定し、その登録用語と前後の登録用語の組合せを話者Qが発声した指令語と認識する。
【0164】
例えば、音声認識部105は、選出した登録用語が前後の認識された登録用語との関係で全体として指令の意味をなさない指令語となる場合は、その選出した登録用語は認識対象から除外し、指令の意味をなす指令語となる場合にその選出した登録用語と前後の登録用語の組合せを話者Qが発声した指令語と認識する。
【0165】
例えば、音声認識部105が音声変換部104から入力された「でんりゅうえいし」の文字列に対して、「でんりゅう」=「電流」と認識し、「えいし」に対して「停止」と「開始」の登録用語を選出したとする。音声認識部105は、「電流開始」は指令語として意味をなさないが、「電流停止」は指令語として意味をなすので、「でんりゅうえいし」を「電流停止」と認識する。
【0166】
そして、音声認識部105は、認識した指令語のデータを指令信号変換部107に出力して(S107:Y)、ステップS108に移行する。
【0167】
一方、音声認識部105は、音声変換部104から入力される文字列に対して閾値E
TH以上の一致度Eを有する登録用語が無い場合は、認識不可の処理結果を指令信号変換部107に出力して(S107:N)、ステップS100に戻る。
【0168】
ステップS108に移行すると、指令信号変換部107は音声認識部105から出力される音声認識の結果に対して、指令語記憶部108に記憶されている指令語を用いて指令信号に変換する処理を行う。
【0169】
指令信号変換部107は、音声認識結果(指令語のデータ)が指令語記憶部108の変換テーブルに含まれている場合、音声認識結果に対応する指令信号を生成して制御部603に出力した後(S108)、ステップS100に戻る。例えば、音声認識部105から出力される音声認識結果が「電流 上げる」の場合、指令信号変換部107は、[電流 上げる](溶接電流を単位電流値ΔI[A]だけ増加させる)の指令語に対応する指令信号を生成して制御部603に入力した後、ステップS100に戻る。
【0170】
また、指令信号変換部107は、音声認識結果が指令語記憶部108の変換テーブルに含まれてない場合や音声認識部105から認識不可により音声認識結果が入力されていない場合、指令信号を生成することなくステップS100に戻る。
【0171】
以上、説明したように、本実施の形態に係る溶接システム4によれば、音声指令入力装置1を用いているので、溶接作業中に作業者が音声により指令を入力した場合でも作業現場に生じる非常に高い騒音の影響を殆ど受けることなく高い精度で安定して音声指令に対応する指令信号を入力することができる。
【0172】
また、作業者Qの頬若しくは口元の周辺部に直接加速度センサ101を取り付け、その加速度センサ101の検出信号Sx,Sy,Szを用いて作業者Qが発声した音声を検出するので、作業者Qの口に近接させてマイクを設ける構成よりもセンサが邪魔にならず、作業者Qの溶接作業への悪影響を低減することができる。
【0173】
また、3軸の加速度センサ101を作業者Qの口元の両側に一対設けて当該口の動きを検出するようにしているので、作業者Qが発声する音声に応じて微妙に変化する口の動きを精度良く検出することができる。
【0174】
また、加速度センサ101は、作業者Qの顔に直接貼着し、ケーブル中継部材2を介して加速度センサ101と装置本体100を電気的に接続するので、加速度センサ101が作業者Qの溶接作業を邪魔して作業性を低下するということがない。
【0175】
また、音声認識部105に入力された音声指令の文字列が言語モデル記憶部106に記憶されている登録用語に完全に一致しない場合でも、例えば、文字列と登録用語の文字の一致度Eを算出し、その一致度Eを用いて音声指令の文字列に一致する確率の高い指令語を作業者Qの発声した音声指令と認識するようにしているので、加速度センサ101による作業者Qの口の動きの検出値を用いて音声指令を好適に認識することができる。
【0176】
また、音声変換部104が音声指令の音素を変換した文字に誤変換が含まれている場合でも音声認識部105で登録用語との一致度Eを算出し、その一致度Eを用いて音声指令による指令語を認識するようにしているので、高い精度で作業者Qが発声した音声指令に対応する指令信号をワイヤ送給装置6の制御部603に入力することができる。
【0177】
上記の実施の形態では、操作部604に選択スイッチを設け、作業者が選択スイッチを操作して音声による操作指令を入力可能にしていたが、選択スイッチに代えてモード切換スイッチを操作部604に設けてもよい。
【0178】
モード切換スイッチは、操作指令の入力モードを音声による入力モード(音声入力モード)と操作ボタン又はトーチスイッチ701による入力モード(通常入力モード)とに切り換えるスイッチである。
【0179】
作業者がモード切換スイッチで音声入力モードを設定すると、制御部603は、操作部604の操作ボタン又はトーチスイッチ701による操作指令信号の受け付け制御を行うとともに、音声指令入力装置1からの操作指令信号の受け付け制御を行う。逆に、作業者がモード切換スイッチで通常入力モードを設定すると、制御部603は、操作部604操作ボタン又はトーチスイッチ701による操作指令信号を受け付けるが、音声指令入力装置1からの操作指令信号を受け付けない制御を行う。
【0180】
図7に示す溶接システム4では、遠隔操作装置を備えていてないが、遠隔操作装置を備えていてもよい。
【0181】
図11は、遠隔操作装置を備えた溶接システム野構成の一例を示す図である。
【0182】
図11に示す溶接システム4Aは、ワイヤ送給装置6Aに無線通信によって接続可能な遠隔操作装置10を備えたもので、その遠隔操作装置10に音声指令入力装置1を設けたものである。
【0183】
図7に示す溶接システム4では、音声指令入力装置1を作業者Qの近くに配置されるワイヤ送給装置6に設けていたが、
図11に示す溶接システム4Aでは作業者Qが保持する遠隔操作装置10に設けているので、溶接システム4Aへの音声指令入力装置1の配設をより容易且つコンパクトにすることができる。
【0184】
特に、ワイヤ送給装置6に音声指令入力装置1を設ける場合は、作業者Qのワイヤ送給装置6からの移動を考慮して加速度センサ101から音声指令入力装置1の装置本体100までの配線に余裕を必要とするが、遠隔操作装置10に音声指令入力装置1を設ける場合は、作業者Qと遠隔操作装置10との距離が短く、その距離の変化も少ないので、加速度センサ101から音声指令入力装置1の装置本体100までの配線をよりコンパクトにすることができる。
【0185】
溶接システム4Aの
図7に示す溶接システム4との構成上の相違点について、簡単に説明すると、以下の通りである。
【0186】
溶接システム4Aでは、ワイヤ送給装置6Aは、無線通信部607を備えている。無線通信部607は、例えば、無線LANにより遠隔操作装置10との間で無線通信を行う。無線通信部607は、無線LANアクセスポイント(図示省略)を介して遠隔操作装置10と無線接続を行い、無線通信により所定の情報の送受信を行う。無線通信部607は、所定の変調方式でキャリア信号を送信すべき情報で変調して無線通信信号を生成し、その無線通信信号をアンテナ607Aから放射する。
【0187】
例えば、無線通信部607は、制御部603から溶接電圧と溶接電流の情報が転送されると、その情報を用いて無線通信信号を生成し、その無線通信信号を遠隔操作装置10に送信する。また、無線通信部607は、制御部603から溶接電圧検出値と溶接電流検出値の情報が転送されると、その情報を用いて無線通信信号を生成し、その無線通信信号を遠隔操作装置10に送信する。
【0188】
また、無線通信部607は、遠隔操作装置10から無線通信信号を受信すると、送信された情報を復調し、制御部603に転送する。また、無線通信部607は、受信レベルを検出し、その検出値を制御部603に入力する。制御部603は、無線通信の通信状態を表示させるために、その検出値に基づいて、受信レベルに関する情報を生成し、その情報を表示部605に転送する。
【0189】
遠隔操作装置10は、リモコンと呼ばれるものである。遠隔操作装置10は、機能ブロックとして、電池1001、制御部1002、無線通信部1003、操作部1004及び表示部1005と、上述した音声指令入力装置1の音声指令入力部109を含む。
【0190】
電池1001は、遠隔操作装置10の駆動電源である。電池1001、無線通信部1003、操作部1004、表示部1005及び音声指令入力部109は制御部1002に接続されている。
【0191】
制御部1002は、操作部1004による情報の入力、表示部1005による情報の出力、音声指令入力部109による音声指令の入力、無線通信部1003によるワイヤ送給装置6Aとのデータ通信などの各処理を統括的に制御する。制御部1002は、ROM、RAM及びMPUを有するマイクロコンピュータで実現されている。制御部1002もFPGAなどのPLDで実現してもよい。
【0192】
操作部1004は、作業者がアーク溶接に関する各種の情報を制御部1002に入力する操作を行うブロックである。操作部1004は、遠隔操作装置10の筐体面に配設された操作パネルに設けられており、ワイヤ送給装置6Aの操作部604と同様の機能を果たす。
【0193】
作業者が操作部1004の起動、溶接電圧の設定・変更、溶接電流の設定・変更など操作ボタンを操作すると、その操作ボタンに対応する所定の操作指令信号が制御部1002に入力される。
【0194】
遠隔操作装置10では、作業者は、操作指令を操作部1004と音声指令入力装置1のいずれかで入力することができる。このため、遠隔操作装置10の操作パネルには、操作指令を入力する装置を選択するための選択ボタンが設けられている。この選択ボタンは、例えば、モーメンタリー・スイッチで構成され、作業者がモーメンタリー・スイッチをオン状態にしている期間に音声指令入力装置8を用いて音声により操作指令を制御部1002に入力することができる。
【0195】
表示部1005は、アーク溶接に関する各種の情報や電池1001の残容量に関する情報やワイヤ送給装置6Aとの無線通信状態などを表示する。表示部1005は、例えば、液晶ディスプレイなどの表示装置で構成される。表示部1005は、LEDや7セグメントなどの表示機で構成されてもよい。
【0196】
表示部1005は、制御部1002から転送される情報に基づいて、所定の表示をする。例えば、表示部1005は、制御部1002から入力される電池1001の電圧に関する情報に基づいて、電池1001の残容量に関する情報を絵文字や記号や文字メッセージなどで表示する。また、表示部1005は、制御部1002から入力される受信レベルに関する情報に基づいて、無線通信の通信状態に関する情報を絵文字や記号や文字メッセージなどで表示する。
【0197】
また、表示部1005は、制御部1002から転送される入力情報(操作部1004又は音声指令入力部109から入力された情報や無線通信部1003を介してワイヤ送給装置6Aから入力された情報)を表示する。
【0198】
無線通信部1003は、ワイヤ送給装置6Aとの間で無線通信を行う。無線通信部1003は、無線通信部34と同様に、無線LANによりワイヤ送給装置6Aとの間で無線通信を行う。
【0199】
無線通信部1003は、無線LANアクセスポイント(図示省略)を介してワイヤ送給装置6Aと無線接続を行い、無線通信により所定の情報の送受信を行う。無線通信部1003は、無線通信部607と同じ変調方式でキャリア信号を送信すべき情報で変調して無線通信信号を生成し、その無線通信信号をアンテナ1003Aから放射する。
【0200】
例えば、無線通信部1003は、制御部1002から溶接電圧と溶接電流の情報が転送されると、その情報を用いて無線通信信号を生成し、その無線通信信号をワイヤ送給装置6Aに送信する。
【0201】
また、無線通信部1003は、ワイヤ送給装置6Aから無線通信信号を受信すると、送信された情報を復調し、制御部1002に転送する。また、無線通信部1003は、受信レベルを検出し、その検出値を制御部1002に入力する。制御部1002は、無線通信の通信状態を表示させるために、その検出値に基づいて、受信レベルに関する情報を生成し、その情報を表示部1005に転送する。
【0202】
溶接システム4Aでは、音声指令入力装置1によって作業者Qの発声した音声指令が指令信号に変換されて遠隔操作装置10の制御部1002に入力されると、制御部1002がその指令信号に対応する操作指令の情報を無線通信によってワイヤ送給装置6Aの制御部603に送信し、さらに制御部603からその操作指令の情報が溶接電源装置5の制御部502に転送される。
【0203】
これにより、溶接電源装置5ではワイヤ送給装置6Aから入力された操作指令の情報に対応する所定の動作が行われる。例えば、操作指令の内容が「溶接電流の増加」であれば、溶接電源装置5では、溶接用電源5011が溶接トーチ7と母材Bに供給している溶接電流をΔIだけ増加する制御が行われる。
【0204】
なお、
図11の構成では、遠隔操作装置10がワイヤ送給装置6Aとの間で無線通信をする構成であるが、遠隔操作装置10は、溶接電源装置5との間で無線通信をする構成であってもよく、溶接電源装置5とワイヤ送給装置6Aの両方に対して無線通信をする構成であってもよい。
【0205】
以上、説明したように本実施の形態に係る溶接システム4,4Aによれば、加速度センサ101によって作業者Qが音声指令を発したときの頬若しくは口元の動きを検出し、その検出結果に基づいて音声指令の内容を認識し、その音声指令に対応する指令信号を溶接電源装置5の制御部502に入力するようにしているので、溶接作業現場の騒音が高い環境でもその騒音の影響を受けることなく音声指令の内容を認識することができる。
【0206】
特に、溶接システム4,4Aでは、操作ボタンによる溶接条件の変更等の操作指令が比較的簡単な内容であり、音声による指令語も簡単且つ少ない音素で構成されるので、加速度センサ101による作業者Qの頬若しくは口元の動きの検出値を用いた音声指令の認識処理でも誤動作や誤認識を低減することができる。
【0207】
また、加速度センサ101による作業者Qの頬若しくは口元の動きの検出値から求めた音声指令の音素の一部に誤検出があっても、例えば、文字列と登録用語の文字の一致度Eを算出し、その一致度Eを用いて音声指令の文字列に一致する確率の高い登録用語又は登録用語の組合せを作業者Qの発声した音声指令と認識するようにしているので、音声指令を高い精度で当該音声指令に対応した指令信号に変換して入力することができる。
【0208】
従って、音声指令により高い精度で安定して溶接に関する捜査指令の指令信号を溶接電源装置5に入力することができる。これにより、作業者Qは、溶接作業中における溶接条件の変更等のための手入力操作が低減され、溶接作業が容易になる。