(19)【発行国】日本国特許庁(JP)
【公報種別】再公表特許(A1)
(11)【国際公開番号】WO/0
(43)【国際公開日】2020年3月12日
【発行日】2021年8月12日
(54)【発明の名称】工作機械の制御装置
(51)【国際特許分類】
G05B 19/18 20060101AFI20210716BHJP
【FI】
G05B19/18 X
【審査請求】有
【予備審査請求】未請求
【全頁数】13
【出願番号】特願2020-540982(P2020-540982)
(21)【国際出願番号】PCT/0/0
(22)【国際出願日】2018年9月7日
(81)【指定国】
AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JO,JP,KE,KG,KH,KN,KP,KR,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT
(71)【出願人】
【識別番号】000154990
【氏名又は名称】株式会社牧野フライス製作所
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100160705
【弁理士】
【氏名又は名称】伊藤 健太郎
(72)【発明者】
【氏名】佐藤 仁
(72)【発明者】
【氏名】増宮 泰徳
(72)【発明者】
【氏名】吉田 智雄
【テーマコード(参考)】
3C269
【Fターム(参考)】
3C269AB31
3C269BB07
3C269BB11
3C269CC02
3C269MN09
3C269MN26
3C269MN47
3C269MN50
3C269QC04
(57)【要約】
工作機械の制御装置(100)が、複数の人の各顔の画像データと音声データとを各人のIDと関連付けて格納した個人データベース(108)と、工作機械へ入力可能な指令を格納した入力コマンドデータベース(120)と、人の顔を撮像する撮像装置(102)と、音声を入力するマイクロフォン(104)と、撮像装置で撮像された人の顔の画像データと、マイクロフォンから入力された音声データとを処理するマイクロプロセッサとを備え、マイクロプロセッサが、顔の画像データに基づいて顔認証を行い、マイクロフォンから入力された音声データに基づいて音声認証を行って、該音声が顔認証された人の発する音声である場合に、音声データを分析し、分析結果に基づいて入力コマンドデータベースを検索して、音声データに対応した指令を工作機械に入力するようにした。
【特許請求の範囲】
【請求項1】
工作機械の制御装置において、
複数の人の各顔のデータと音声データとを各人のIDと関連付けて格納した個人データベースと、
前記工作機械へ入力可能な指令を格納した入力コマンドデータベースと、
人の顔を撮像する撮像装置と、
音声を入力するマイクロフォンと、
前記撮像装置で撮像された人の顔のデータと、前記マイクロフォンから入力された音声データとを処理するマイクロプロセッサとを備え、
前記マイクロプロセッサが、
前記顔のデータに基づいて顔認証を行い、
前記マイクロフォンから入力された音声データを処理する際、顔認証で特定した人毎に前記個人データベースに基づいて、その処理に伴う各人の操作支援を行い、
前記音声データを分析し、分析結果に基づいて前記入力コマンドデータベースを検索して、音声データに対応した指令を前記工作機械に入力することを特徴とした工作機械の制御装置。
【請求項2】
前記マイクロプロセッサは、前記音声データを分析したときに、前記入力コマンドデータベースを検索するために十分な情報が得られなかった場合、音声データの入力者に対して不足している情報に関して質問するようにした請求項1に記載の工作機械の制御装置。
【請求項3】
前記マイクロプロセッサは音声を生成して前記質問を行う請求項2に記載の工作機械の制御装置。
【請求項4】
前記マイクロプロセッサは、ティスプレイに文字を表示して前記質問を行う請求項2に記載の工作機械の制御装置。
【請求項5】
前記個人データベースは、格納されている人の各々のくせ、好み、加工ノウハウ、加工工程順序、身長、母国語、視力、聴力、色覚、熟練度および過去の操作履歴から選択される少なくとも1つの項目を含んでおり、
前記マイクロプロセッサは、音声入力した人のくせ、好み、加工ノウハウ、加工工程順序、身長、母国語、視力、聴力、色覚、熟練度および過去の操作履歴から選択される少なくとも1つの項目に適合した操作画面をディスプレイ上に生成する請求項1に記載の工作機械の制御装置。
【請求項6】
前記マイクロプロセッサは、顔のデータ、音声データおよび前記個人データベースに基づいて、音声入力する人の身体的、心理的状態を予測し、音声入力する人へ必要な注意喚起する請求項1に記載の工作機械の制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オペレータが音声入力により工作機械に対して各種指示を行えるようにした工作機械の制御装置に関する。
【背景技術】
【0002】
特許文献1には、複数の制御軸を有する数値制御工作機械において、入力した音声を識別して該音声に対応する駆動信号発生指令信号を出力し、駆動信号発生指令信号に基づき駆動信号を出力して、駆動信号に基づき各制御軸を制御するようにした数値制御工作機械が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平1−125605号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
工作機械の設置される工場等では、複数のオペレータが複数の工作機械を操作していることが多い。そうした場合、特許文献1の発明では、音声による指令が誰がどの工作機械へ向けて発した指令であるのかが不明確であるので、オペレータが音声で発した指令が意図した工作機械に正確に入力できないことがある。
【0005】
本発明は、こうした従来技術の問題を解決することを技術課題としており、音声入力するオペレータを確実に特定し、オペレータ毎の好みや特徴に応じて、最適な操作支援をできるようにした工作機械の制御装置を提供することを目的としている。
【課題を解決するための手段】
【0006】
上述の目的を達成するために、本発明によれば、複数の人の各顔のデータと音声データとを各人のIDと関連付けて格納した個人データベースと、前記工作機械へ入力可能な指令を格納した入力コマンドデータベースと、人の顔を撮像する撮像装置と、音声を入力するマイクロフォンと、前記撮像装置で撮像された人の顔のデータと、前記マイクロフォンから入力された音声データとを処理するマイクロプロセッサとを備えた工作機械の制御装置において、
前記マイクロプロセッサが、前記顔のデータに基づいて顔認証を行い、前記マイクロフォンから入力された音声データを処理する際、顔認証で特定した人毎に前記個人データベースに基づいて、その処理に伴う各人の操作支援を行い、前記音声データを分析し、分析結果に基づいて前記入力コマンドデータベースを検索して、音声データに対応した指令を前記工作機械に入力するようにした工作機械の制御装置が提供される。
【発明の効果】
【0007】
本発明によれば、オペレータが工作機械に対して音声で指令を入力する際、入力された音声データが、従前に顔認証されたオペレータによって入力されているのか否かを判定することによって、工作機械の周囲に複数のオペレータが作業をしている場合でも、工作機械に対して指令するオペレータ(個人)を確実に特定することができ、工作機械の誤作動を確実に防止可能となる。
【0008】
マイクロプロセッサは、個人データベースに格納されている各人のくせ、好み、加工ノウハウ、加工工程順序、身体上の特質、熟練度および過去の履歴の少なくとも1つの項目に適合した操作画面をディスプレイ上に生成するので、各人が使い勝手良く、熟練度に応じた最適な加工方法を実行して工作機械を操作できる。更に、音声データを分析したとき、入力コマンドデータベースを検索するために十分な情報が得られなかった場合、音声データの入力者に対して不足している情報に関して質問するようにしたので、工作機械の制御装置の動作が中断することなく、誤動作を防止することもできる。こうして、熟練度の低いオペレータでも誤動作することなく、工作機械の操作が行え、また熟練オペレータは、経験を生かして高度な加工を能率よく行えるようになる。
【図面の簡単な説明】
【0009】
【
図1】本発明の好ましい実施形態による工作機械の制御装置を示すブロック図である。
【
図2】
図1の制御装置による制御を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、本発明の好ましい実施形態を説明する。
図1において、本発明の好ましい実施形態による音声入力制御装置100は、機械制御部14と協働して工作機械10を制御する。工作機械10は、先端に回転工具を着脱可能に保持する回転主軸、ワークを固定するテーブル、および、回転主軸とテーブルとを相対的に少なくとも直交3軸方向に直線送りする送り軸装置を有した加工機(図示せず)と、複数の工具を収納した工具マガジン(図示せず)と、加工機の回転主軸と工具マガジンとの間で回転工具を交換する工具交換装置(図示せず)と、加工機や工具マガジンへクーラントを供給するクーラント供給装置(図示せず)等を備えたマシニングセンタとすることができる。工作機械10を構成する加工機は、回転主軸にワークを取り付け、回転するワークに対して静止した工具(バイト)を押し付けて切削加工する旋盤であってもよい。
【0011】
機械制御部14は、加工機の回転主軸を駆動する主軸モータ(図示せず)および直交3軸の直線送り軸装置のX軸、Y軸、Z軸の各送り軸モータ(図示せず)を少なくとも制御するNC装置16、および、工作機械10の工具マガジン、工具交換装置、クーラント供給装置等を制御するPLC18を含むことができる。工作機械10を包囲するカバー(図示せず)には、機械制御部14へ種々の指令を入力するキーボードやスイッチ類24、工作機械10の作動状態を表示する表示部24、工作機械10のオン−オフスイッチ26を備えた操作盤20が取り付けられている。
【0012】
音声入力制御装置100は、顔認識部106、音声認識部110、自然言語処理部116、予測部118、指令生成部122、返答作成部126、発話生成部128、個人データベース108、入力コマンドデータベース120、機械状態データベース136を主要な構成要素として具備しており、CPU(中央演算素子)、RAM(ランダムアクセスメモリ)やROM(リードオンリーメモリ)のようなメモリ装置、HDD(ハードディスクドライブ)やSSD(ソリッドステートドライブ)のような記憶デバイス、出入力ポート、および、これらを相互接続する双方向バスを含むコンピュータ装置および関連するソフトウェアから構成することができる。
【0013】
音声入力制御装置100は、1つのコンピュータ装置または複数のコンピュータ装置から構成することができる。或いは、工作機械10のための機械制御部14の一部としてソフトウェア的に構成してもよい。更に、個人データベース108、入力コマンドデータベース120、工具データベース124および機械状態データベース136の1または複数のデータベースを上記コンピュータ装置に接続されたネットワークドライブのような記憶デバイスから構成してもよい。
【0014】
個人データベース108は、各オペレータの平常時の顔画像、方言や独特の現場用語や言い回しで話をすることも含めた音声データ、操作画面の好み、操作盤スイッチの操作順序の習慣や、過去のアラーム発報の履歴、身体的特徴等のオペレータの特質、各オペレータの過去の体調や表情と顔画像や音声データとの関係などを蓄積し、刻々と更新している。
【0015】
入力コマンドデータベース120は、工作機械10に入力可能な指令が、例えば一覧形式で格納されている。工具データベース124は、工具マガジン撮像部12で撮像した工具をはじめ、工場内に存在する工具のID、種類、名称、サイズ、材質、摩耗状態等のデータを蓄積し、刻々と更新している。機械状態データベース136は、オペレータドアの開閉、主軸工具のクランプ、アンクランプ、送り軸が原点復帰しているか否か等の機械の状態を示す、機械各部に設けられたセンサの現時点における出力を格納し、刻々と更新している。
【0016】
以下、
図2のフローチャートを参照して、音声入力制御装置100の作用を説明する。
オペレータが作業を開始する(ステップS10)とき、先ずカメラ102によってオペレータの顔を撮像する(ステップS12)。顔認識部106は、カメラ102によって撮像されたオペレータの顔の画像データを分析し、該画像データに基づいて個人データベース108を検索して、カメラ102によって撮像された個人を識別、特定する。検索の結果、撮像した画像データが個人データベース108の1つの画像データにマッチするとき、このオペレータが工作機械10を操作する権限あるオペレータとして認証され(ステップS14)、個人データベース108に格納されている該オペレータの個人データが選択される。個人データベース108はインターネット114を介して工作機械メーカの音声データベース112に接続することもできる。工作機械メーカの音声データベース112は、全国的あるいは全世界的に収集した大規模データベースである。
【0017】
個人データベース108は、例えば工場内のオペレータの顔画像データおよび音声データが該オペレータのIDと関連付けて格納している。個人データベース108には、また、名前、所属、権限等がオペレータのIDと関連付けて格納されている。顔画像データは、オペレータの標準的な顔の画像データに加えて、オペレータの特定の表情、例えばオペレータが体調不良の時の顔の表情に関連した画像データを含むことができる。音声データも同様に、標準的な音声データに加えて、オペレータが体調不良の時の音声データを含むことができる。
【0018】
権限は、当該オペレータが操作できる機械の機械番号や、操作の種類を含むことができる。操作の種類は、例えば、あるオペレータは、ある工作機械について、直交3軸のみを使った加工はできるが、5軸を用いた加工は許可されていないというような加工プロセスの制限や、工作機械の点検はできるが、消耗品の交換はできないというようなメンテナンス作業上の制限を含むことができる。
【0019】
更に、個人データベース108には、オペレータの特質をオペレータのIDと関連付けて格納することができる。オペレータの特質は、オペレータの身長、母国語、視力、聴力、色覚、熟練度、過去の操作履歴のような項目を含むことができる。オペレータの身長に合わせて操作盤20の上下位置を変更したり、オペレータの母国語に合わせて、操作盤20の表示部22に表示する言語を選択したり、視力に合わせて表示部22に表示する画面の拡大率を変更したり、聴力に合わせてスピーカ130の音量を変更したり、色覚に合わせて、表示部22に表示する画面の色相、明度、彩度を変更したり、オペレータの熟練度によって表示部22に表示する画面を変更したりできる。熟練度による画面の変更は、熟練度の低いオペレータの場合には、起動時に対話型の初期画面を表示するようにし、熟練度の高いオペレータの場合には、該オペレータの好みに合わせて、例えばワーク座標系設定画面を起動時に表示するようにしたりできる。
【0020】
このオペレータがマイクロフォン104を通じて音声入力すると、音声認識部110は、マイクロフォン104を通して入力された人(オペレータ)の音声データを分析し、該音声データに基づいて個人データベース108を検索して、マイクロフォン104から入力された音声を発した個人を識別、特定し、入力された音声が認証されたオペレータの音声であるか否かが判定される(ステップS18)。
【0021】
このように、音声入力に際して、入力された音声データに基づいて再び認証を行い、音声入力しているオペレータが従前に顔認証されたオペレータであるか否かを判定することによって、工作機械10の周囲に複数のオペレータが作業をしている場合に、工作機械10に対して指令するオペレータ(個人)を確実に特定することができ、誤作動を確実に防止可能となる。
【0022】
次いで、音声データは、音声認識部110から自然言語処理部116へ出力される。自然言語処理部116は、音声認識部110から音声データを受け取り、該音声データを字句解析して一連のトークン(トークン列)を生成する(ステップS20)。予測部118は、自然言語処理部116からトークン列を受け取り、該トークン列に基づいて入力コマンドデータベース120を検索し、オペレータが入力しようとしている指令またはオペレータの意図を予測する(ステップS22)。入力コマンドデータベース120には、工作機械10に入力可能な指令の一覧が格納されている。
【0023】
トークン列に基づいて、オペレータが入力しようとしている指令が入力コマンドデータベース120中に見つかった場合(ステップS24でNoの場合)、予測部118は、該コマンドの名称を音声データに関連付けると共に、指令生成部122へこのコマンドの名称を出力する。なお、オペレータの過去の操作履歴を参照しつつ入力コマンドデータベース120を検索するようにしてもよい。
【0024】
指令生成部122は、機械状態データベース136を参照して、予測部118から受け取ったコマンドの名称に対応した指令を工作機械10が実行可能な状態であるか否かを判定するようにできる(ステップS32)。工作機械10が該指令を実行可能な状態である場合(ステップS32でYesの場合)、指令生成部122は該指令を生成して(ステップS34)、機械制御部14へ出力する。機械制御部14は指令生成部122から受け取った指令を実行して(ステップS36)工作機械10を制御すると共に、操作盤20の表示部22にその旨の表示をする。
【0025】
自然言語処理部116から受け取ったトークン列では情報が不足し、入力コマンドデータベース120を参照しても、オペレータが入力しようとしているコマンドを特定することができなかった場合(ステップS24でYesの場合)、予測部118は、その旨の返答をオペレータへ発するための指令を返答作成部126へ出力する(ステップS26)。例えば、予測するために必要な情報が不足して、オペレータが入力しようとしているコマンドを特定できない場合には、予測部118は、不足している情報をオペレータに質問すべく返答を作成するよう返答作成部126に指示する。或いは、入力コマンドデータベース120中に該当するコマンドが見つからなかった場合も、予測部118は、コマンドが見つからないことをオペレータに告知するよう返答作成部126へ指示する。
【0026】
返答作成部126は、予測部118からの指令に基づいて、オペレータの音声入力に対する返答を作成する(ステップS28)。この返答は、例えばテキストデータで作成することができる。返答作成部126は、作成した返答を発話生成部128へ出力する。発話生成部128は、返答作成部126から受け取った返答、例えばテキストデータを読み上げ、スピーカ138から音声として出力する(ステップS30)。返答作成部126は、また、作成した返答のテキストデータを端末装置、例えばタブレットやスマートフォンのようなハンドヘルドコンピュータ装置132のディスプレイ134に表示するようにしてもよい。このディスプレイ134は、また音声入力補助操作画面となっている。
【0027】
指令生成部122が機械状態データベース136を参照したとき、工作機械10が、該指令を実行可能な状態にない場合(ステップS32でNoの場合)、指令生成部122は、その旨オペレータへ告知すべきとの指令を返答作成部126へ出力する(ステップS26)。返答作成部126は、指令生成部122からの指令に基づいて、工作機械10が指令を実行可能な状態ではないことのテキストデータを作成する(ステップS28)。返答作成部126は、作成したテキストデータを発話生成部128へ出力し、発話生成部128は、該テキストデータを読み上げ、スピーカ138から音声信号として出力する(ステップS30)。返答作成部126は、また、作成したテキストデータを端末装置132のディスプレイ134に表示するようにしてもよい。例えば、「オペレータドアが開いていて、指令を実行できませn。オペレータドアを閉めて下さい。」とのテキスト表示や、これを読み上げて音声として出力することができる。
【0028】
予測部118は、また、工具データベース124を参照して、音声データに関連付けたコマンドに適合した工具が準備されているか否かを判定するようにしてもよい。工具が準備されていない場合、予測部118は、その旨の返答をオペレータへ返すべきとの指令を返答作成部126へ出力する。
【0029】
一例として、オペレータが「主軸の工具交換」と命じた場合、予測部118は「どの工具と交換しますか?」と質問を返す。オペレータが「工具経10mmのボールエンドミルに交換」と更に命じると、予測部118は、工具マガジン撮像部12が撮像して工具マガジン内に収納されている全ての工具の工具データを格納している工具データベース124を参照し、例えば「10mmのボールエンドミルはありません。20mmのボールエンドミルはあります。代わりに交換してよろしいですか?」というように工具の状況説明を返すと共に、質問を返すようにできる。
【0030】
また、予測部118は、オペレータの画像データと音声データの少なくとも一方のデータに基づいて、個人データベース108を検索し、身体的、心理的状態を予測し、オペレータへ必要な注意を喚起するようにできる。例えば、オペレータの体調が悪いと判断されるような場合には、予測部118は、他のオペレータと作業を交代することを促すような返答を作成するよう、返答作成部126へ指示することができる。
【0031】
既述の実施形態では、顔認識部106は、カメラ102によって撮像したオペレータの顔の画像データを分析して個人の識別を行うようになっているが、顔の画像データの分析に代えて、顔の各パーツの特徴のデータや、各パーツ間の位置関係のデータ等、顔の他のデータを分析に用いることもできる。
【符号の説明】
【0032】
10 工作機械
14 機械制御部
20 操作盤
102 カメラ
104 マイクロフォン
108 個人データベース
118 予測部
120 入力コマンドデータベース
124 工具データベース
【国際調査報告】