特許7401207 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ファナック株式会社の特許一覧

特許7401207ツールの状態を学習する機械学習装置、ロボットシステム、及び機械学習方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-12-11

(45)【発行日】2023-12-19

(54)【発明の名称】ツールの状態を学習する機械学習装置、ロボットシステム、及び機械学習方法

(51)【国際特許分類】

B25J 13/00 20060101AFI20231212BHJP

G05B 19/4155 20060101ALI20231212BHJP

B25J 13/08 20060101ALI20231212BHJP

【ＦＩ】

B25J13/00 Z

G05B19/4155 V

B25J13/08 Z

【請求項の数】 9

(21)【出願番号】P 2019115371

(22)【出願日】2019-06-21

(65)【公開番号】P2021000692

(43)【公開日】2021-01-07

【審査請求日】2022-03-17

(73)【特許権者】

【識別番号】390008235

【氏名又は名称】ファナック株式会社

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100112357

【弁理士】

【氏名又は名称】廣瀬繁樹

(72)【発明者】

【氏名】▲羽▼根幹人

(72)【発明者】

【氏名】佐藤貴之

【審査官】松浦陽

(56)【参考文献】

【文献】特開２０１７－０３３５２６（ＪＰ，Ａ）

【文献】特開２００３－０１９６４３（ＪＰ，Ａ）

【文献】特開昭５９－１４２０４８（ＪＰ，Ａ）

【文献】特開２０１９－０００９４２（ＪＰ，Ａ）

【文献】特開２０１８－１３８３２７（ＪＰ，Ａ）

【文献】特開２０１４－０６１５５６（ＪＰ，Ａ）

【文献】特開２００３－０１１０８０（ＪＰ，Ａ）

【文献】特開２０１８－０２４０５５（ＪＰ，Ａ）

【文献】中国特許出願公開第１０１６１２７１２（ＣＮ，Ａ）

【文献】特開平１１－２６７９４９（ＪＰ，Ａ）

【文献】特開２０１９－１３９７５５（ＪＰ，Ａ）

【文献】特開２０２０－０６９６００（ＪＰ，Ａ）

【文献】米国特許第０４９２６３０９（ＵＳ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｂ２５Ｊ１／００－２１／０２

Ｇ０５Ｂ１９／１８－１９／４１６

Ｂ２３Ｑ１７／００－１７／２４

Ｂ２３Ｑ１５／００－１５／２８

(57)【特許請求の範囲】

【請求項1】

ロボットが作業に用いるツールの状態を学習する機械学習装置であって、
前記ロボットが前記ツールに所定の動作を行わせている間に前記ツールから前記ロボットに加わる力のデータと、前記所定の動作を行っているときの前記ツールの状態を示すデータと、前記ツールの作業対象となるワークの粗さ又は剛性率の数値のデータと、を、学習データセットとして取得する学習データ取得部と、
前記学習データセットを用いて、前記力と前記ツールの状態との相関性を表す学習モデルを、前記力と前記数値との関連性を加味して生成する学習部であって、前記学習モデルは、前記力及び前記数値のデータの入力を受け付けて、該数値に対応する該力と前記相関性を有する前記状態のデータを出力する、学習部と、を備える、機械学習装置。

【請求項2】

前記学習データ取得部は、前記所定の動作を行っているときの前記ツールの位置及び姿勢のデータを、前記学習データセットとしてさらに取得し、
前記学習部は、前記相関性に前記力と前記位置及び姿勢との関連性を加味して前記学習モデルを生成する、請求項１に記載の機械学習装置。

【請求項3】

前記ツールは、回転動作によりワークを研磨する研磨材であり、
前記所定の動作は、
前記研磨材をワークに接触させることなく回転させる動作、又は
前記研磨材をワークに接触させて回転させる動作である、請求項１又は２に記載の機械学習装置。

【請求項4】

前記ツールは、前記状態が経時で変化する既知の耐用期間を有し、
前記学習部は、前記耐用期間に含まれる複数の小期間の各々について前記学習モデルを生成する、請求項１～３のいずれか１項に記載の機械学習装置。

【請求項5】

前記学習データ取得部は、前記ロボットが前記力を制御する力制御を実行している間の前記力のデータを取得する、請求項１～４のいずれか１項に記載の機械学習装置。

【請求項6】

前記力のデータは、該力の時間変化特性、該力の振幅値、及び該力の周波数スペクトラムの少なくとも１つを含む、請求項１～５のいずれか１項に記載の機械学習装置。

【請求項7】

ツールを用いて作業を行うロボットと、
請求項１～６のいずれか１項に記載の機械学習装置と、
前記力を検出し、前記力のデータとして前記学習データ取得部に供給する力センサと、
前記学習部が生成した前記学習モデルに基づいて、前記ロボットが前記作業に際して前記所定の動作を行っているときの前記ツールの状態を判定する状態判定部と、を備える、ロボットシステム。

【請求項8】

前記力センサの故障の有無を検知する故障検知部をさらに備える、請求項７に記載のロボットシステム。

【請求項9】

ロボットが作業に用いるツールの状態を学習する機械学習方法であって、
プロセッサが、
前記ロボットが前記ツールに所定の動作を行わせている間に前記ツールから前記ロボットに加わる力のデータと、前記所定の動作を行っているときの前記ツールの状態を示すデータと、前記ツールの作業対象となるワークの粗さ又は剛性率の数値のデータと、を、学習データセットとして取得し、
前記学習データセットを用いて、前記力と前記ツールの状態との相関性を表す学習モデルを、前記力と前記数値との関連性を加味して生成し、
前記学習モデルは、前記力及び前記数値のデータの入力を受け付けて、該数値に対応する該力と前記相関性を有する前記状態のデータを出力する、機械学習方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ロボットが作業に用いるツールの状態を学習する機械学習装置、ロボットシステム、及び機械学習方法に関する。

【背景技術】

【0002】

工具でワークを加工しているときの音又は振動の特徴を学習し、工具の劣化度を判定する技術が知られている（特許文献１）。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１８－１５６３４０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

ロボットの分野においては、ロボットがツールを用いて作業を行っているときに、ツールからロボットに加わる力を検出する。このように検出される力から、ツールの状態を判定する技術が求められている。

【課題を解決するための手段】

【0005】

本開示の一態様において、ロボットが作業に用いるツールの状態を学習する機械学習装置は、ロボットがツールに所定の動作を行わせている間にツールからロボットに加わる力のデータと、所定の動作を行っているときのツールの状態を示すデータとを、学習データセットとして取得する学習データ取得部と、学習データセットを用いて、力とツールの状態との相関性を表す学習モデルを生成する学習部とを備える。

【0006】

本開示の他の態様において、ロボットが作業に用いるツールの状態を学習する機械学習方法は、プロセッサが、ロボットがツールに所定の動作を行わせている間にツールからロボットに加わる力のデータと、所定の動作を行っているときのツールの状態を示すデータとを、学習データセットとして取得し、学習データセットを用いて、力とツールの状態との相関性を表す学習モデルを生成する。

【発明の効果】

【0007】

本開示によれば、ロボットがツールに所定の動作を行わせているときに該ツールからロボットに加わる力と該ツールの状態との相関性を定量的に表すモデルを、自動的且つ正確に求めることができる。

【図面の簡単な説明】

【0008】

【図1】一実施形態に係る学習装置のブロック図である。

【図2】一実施形態に係るロボットにエンドエフェクタを取り付けた状態を示す。

【図3】図２に示すロボットに、他のエンドエフェクタを取り付けた状態を示す。

【図4】図２に示すロボットに、さらに他のエンドエフェクタを取り付けた状態を示す。

【図5】図２に示すロボットに、さらに他のエンドエフェクタを取り付けた状態を示す。

【図6】図５に示すロボットで把持したツールを穴に嵌入した状態を示す。

【図7】図１に示す機械学習装置が行う学習サイクルの一例を示すフローチャートである。

【図8】ニューロンのモデルを模式的に示す。

【図9】多層ニューラルネットワークのモデルを模式的に示す。

【図10】一実施形態に係るロボットシステムのブロック図である。

【図11】図１０に示すロボットシステムの動作フローの一例を示すフローチャートである。

【発明を実施するための形態】

【0009】

以下、本開示の実施の形態を図面に基づいて詳細に説明する。なお、以下に説明する種々の実施形態において、同様の要素には同じ符号を付し、重複する説明を省略する。図１を参照して、一実施形態に係る機械学習装置１０について説明する。機械学習装置１０は、プロセッサ（ＣＰＵ、ＧＰＵ等）、記憶部（ＲＯＭ、ＲＡＭ等）、及び入力装置（キーボード、マウス、タッチパネル等）等を有するコンピュータ、又は、学習アルゴリズム等のソフトウェアから構成され得る。

【0010】

機械学習装置１０は、後述するロボット２０が作業に用いるツールの状態（正常状態、異常状態等）を学習する。図２～図７に、ロボット２０と、該ロボット２０に取り付けられる種々のエンドエフェクタとを示す。図２に示すように、ロボット２０は、垂直多関節ロボットであって、ベース部２２、旋回胴２４、下腕部２６、上腕部２８、手首部３０を有する。

【0011】

ベース部２２は、作業セルの床の上に固定される。旋回胴２４は、鉛直軸周りに回動可能となるようにベース部２２に設けられている。下腕部２６は、水平軸周りに回動可能となるように旋回胴２４に設けられている。上腕部２８は、下腕部２６の先端部に回動可能に設けられている。手首部３０は、上腕部２８の前端部に回動可能に設けられている。

【0012】

図２に示す例においては、手首部３０の先端部に、ワークを研磨するためのエンドエフェクタ４０が着脱可能に取り付けられている。手首部３０は、エンドエフェクタ４０を回動可能に支持する。ロボット２０には、複数のサーボモータ（図示せず）が内蔵され、これらサーボモータは、ロボット２０の可動要素（すなわち、旋回胴２４、下腕部２６、上腕部２８、手首部３０）を駆動し、エンドエフェクタ４０を任意の位置及び姿勢に配置させる。

【0013】

エンドエフェクタ４０は、ベース部４２と、軸線Ａ_１周りに回転可能にベース部４２に設けられたツール４４と、該ツール４４を回転駆動する駆動部４６を有する。ベース部４２は、手首部３０の先端部に連結されている。ツール４４は、例えば、研磨砥粒（セラミック、ジルコニア、ダイアモンド等）を含む略円柱状の研磨材であって、回転動作によりワークを研磨する。駆動部４６は、例えばサーボモータであって、ツール４４を軸線Ａ_１周りに回転させる。

【0014】

手首部３０とエンドエフェクタ４０との間には、力センサ３２が介挿されている。力センサ３２は、例えば、複数の歪ゲージを有する６軸力覚センサであって、該力センサ３２に作用する力を検出する。より具体的には、力センサ３２は、各々の歪ゲージから、該力センサ３２に生じる歪に応じた出力信号Ｓ_Ｏを出力する。

【0015】

これら出力信号Ｓ_Ｏに基づいて、力センサ座標系Ｃ_Ｆのｘ軸方向の力Ｆ_ｘ、ｙ軸方向の力Ｆ_ｙ、及びｚ軸方向の力Ｆ_ｚと、該ｘ軸周りのモーメントＭ_ｘ、該ｙ軸周りのモーメントＭ_ｙ、該ｚ軸周りのモーメントＭ_ｚとの、計６方向の力Ｆ_ｘ、Ｆ_ｙ、Ｆ_ｚ、Ｍ_ｘ、Ｍ_ｙ、及びＭ_ｚを検出することができる。

【0016】

そして、これら６方向の力Ｆ_ｘ、Ｆ_ｙ、Ｆ_ｚ、Ｍ_ｘ、Ｍ_ｙ、Ｍ_ｚから、エンドエフェクタ４０（例えば、ツール４４）に掛かる力Ｆ_Ｅの大きさ及び方向を検出することができる。なお、力センサ座標系Ｃ_Ｆは、例えば、その原点が力センサ３２における所定位置（例えば、中心）に配置され、そのｚ軸方向が、力センサ３２の中心軸線と平行となるように、該力センサ３２に対して設定される。

【0017】

一方、図３に示す例においては、ロボット２０の手首部３０に、ワークを研磨するための他のエンドエフェクタ５０が取り付けられている。エンドエフェクタ５０は、ベース部５２と、軸線Ａ_２周りに回転可能にベース部５２に設けられたツール４４と、該ツール４４を回転駆動する駆動部５４を有する。

【0018】

ベース部５２は、力センサ３２を介して手首部３０の先端部に取り付けられている。駆動部５４は、例えばサーボモータであって、ツール４４を軸線Ａ_２周りに回転させる。図２及び図３に示す例においては、ロボット２０は、ツール４４を用いてワークを研磨する作業を行う。

【0019】

図４に示す例においては、ロボット２０の手首部３０に、ワークＷ_１を切削加工（例えば、バリ取り）するためのエンドエフェクタ６０が着脱可能に取り付けられている。具体的には、エンドエフェクタ６０は、ベース部６２と、軸線Ａ_３周りに回転可能にベース部６２に設けられたツール６４と、該ツール６４を回転駆動する駆動部６６とを有する。ベース部６２は、力センサ３２を介して手首部３０の先端部に取り付けられている。

【0020】

ツール６４は、鋼鉄等から構成された、先端部が略円錐状の切削工具であって、回転動作によりワークＷ_１を切削加工する。駆動部６６は、例えばモータ又は圧縮気体によって動力を発生させる装置であって、ベース部６２に内蔵され、ツール６４を軸線Ａ_３周りに回転させる。ロボット２０は、ツール６４を用いてワークを切削加工（バリ取り等）する作業を行う。

【0021】

図５に示す例においては、ロボット２０の手首部３０に、エンドエフェクタ７０が着脱可能に取り付けられている。エンドエフェクタ７０は、ツール７４をハンドリングするロボットハンドであって、ベース部７２と、該ベース部７２に開閉可能に設けられた複数の指部７６と、該指部７６を駆動する駆動部７８を有する。

【0022】

ベース部７２は、力センサ３２を介して手首部３０の先端部に取り付けられている。指部７６は、互いに接近及び離反する方向へ移動可能となるようにベース部７２に設けられ、ツール７４を把持したり、解放したりする。駆動部７８は、例えばサーボモータ又はシリンダであって、ベース部７２に内蔵されている。

【0023】

ツール７４は、円筒状又は多角柱状の部材（自動車用シリンダ等）である。ロボット２０は、エンドエフェクタ７０でツール７４を把持し、図６に示すように、把持したツール７４を、作業対象のワークＷ_２に形成された穴Ｈに嵌入し、該ツール７４を該ワークＷ_２に組み付ける作業を行う。

【0024】

再度、図１を参照して、機械学習装置１０は、学習データ取得部１２、及び学習部１４を備える。学習データ取得部１２は、ロボット２０がツール４４、６４、又は７４に所定の動作を行わせている間に該ツール４４、６４、又は７４からロボット２０に加わる力Ｆのデータと、該所定の動作を行っているときの該ツール４４、６４、又は７４の状態Ｓを示すデータとを、学習データセットとして取得する。

【0025】

例えば、図２～図４に示す例において、「所定の動作」とは、ロボット２０がツール４４又は６４を、ワークに接触させることなく回転させる動作である。代替的には、「所定の動作」とは、ロボット２０がツール４４又は６４を、ワークに接触させて回転させる動作である。ここで、ロボット２０は、所定の動作としてツール４４又は６４をワークに接触させて回転させる動作を行うときに、該ツール４４又は６４からロボット２０に加わる力Ｆ（換言すれば、ツール４４又は６４からワークに加わる力）を、所定の目標値に制御する力制御を実行してもよい。

【0026】

また、図５に示す例において、「所定の動作」とは、ロボット２０がツール７４を穴Ｈに嵌入する動作である。ここで、ロボット２０は、所定の動作としてツール７４を穴Ｈに嵌入する動作を行うときに、ツール７４からロボット２０に加わる力Ｆ（換言すれば、ツール７４からワークＷ_２に加わる力）を、所定の目標値に制御する力制御を実行してもよい。

【0027】

このように、ロボット２０の手首部３０には、作業に応じて種々のエンドエフェクタ４０、５０、６０又は７０が取り付けられ、ロボット２０は、ツール４４、６４又は７４に、所定の動作を行わせる。力センサ３２は、ロボット２０がツール４４、６４又は７４に所定の動作を実行させているときに、該ツール４４、６４又は７４からロボット２０に加わる力Ｆを検出し、力Ｆのデータを、学習データ取得部１２に供給する。

【0028】

例えば、図２～図４に示す例において、ロボット２０が所定の動作として、ツール４４又は６４をワークに接触させることなく（又は、ワークに接触させて）回転させる動作を行っているとき、ツール４４又は６４の回転によって力センサ３２に力が加わる。力センサ３２は、このような力を、所定の動作時にツール４４又は６４からロボット２０に加わる力Ｆとして検出する。

【0029】

また、図５に示す例において、ロボット２０が所定の動作として、ツール７４を穴Ｈに嵌入する動作を行っているとき、ツール７４を穴Ｈに嵌入する動作に起因する力が力センサ３２に加わる。力センサ３２は、このような力を、所定の動作時にツール７４からロボット２０に加わる力Ｆとして検出する。学習データ取得部１２は、力センサ３２が検出した力Ｆのデータを、該力センサ３２から取得する。力Ｆのデータは、上述の出力信号Ｓ_Ｏ、力Ｆ_ｘ、Ｆ_ｙ、Ｆ_ｚ、Ｍ_ｘ、Ｍ_ｙ、及びＭ_ｚ、並びに、エンドエフェクタ４０に掛かる力Ｆ_Ｅのうちの少なくとも１つを含む。

【0030】

また、力Ｆのデータは、データＳ_Ｏ、Ｆ_ｘ、Ｆ_ｙ、Ｆ_ｚ、Ｍ_ｘ、Ｍ_ｙ、Ｍ_ｚ、Ｆ_Ｅの時間変化特性ＣＴ、振幅値ＡＰ（正又は負のピーク値、ピークピーク値等）、及び周波数スペクトラムＦＳの少なくとも１つを含んでもよい。また、時間変化特性ＣＴ又は周波数スペクトラムＦＳは、所定の時間τに亘って検出されたデータであってもよい。また、振幅値ＡＰは、所定の時間τの平均値又は最大値であってもよい。また、所定の時間τは、ロボット２０が行う「所定の動作」の始期から終期までの時間であってもよいし、又は、「所定の動作」中の任意の時間（例えば、１秒）であってもよい。

【0031】

一方、ツール４４、６４又は７４の状態Ｓを示すデータは、例えば、「正常状態」、「異常状態」等のラベル情報を含む。ここで、異常状態とは、例えば、ツール４４、６４又は７４に、欠け、割れ又は亀裂等の損傷が生じている状態である。一方、正常状態とは、ツール４４、６４又は７４に損傷が生じていない状態である。

【0032】

なお、「正常状態」のラベル情報として、「新品状態」、「中古状態」といった複数のラベル情報を設定してもよい。また、「異常状態」のラベル情報として、「異常状態レベル１」、「異常状態レベル２」、「異常状態レベル３」といったように、異常状態の度合いに応じた複数のラベル情報を設定してもよい。

【0033】

ツール４４、６４又は７４の状態Ｓを示すデータは、オペレータによって定められる。例えば、オペレータは、目視等によって、ツール４４、６４又は７４の状態（正常状態、異常状態）を確認し、該ツール４４、６４又は７４の状態Ｓを示すデータを学習データ取得部１２に入力する。

【0034】

代替的には、オペレータは、ツール４４、６４又は７４の画像データと、該ツール４４、６４又は７４の状態Ｓとの相関性を表す学習モデルＬＭ２を予め準備し、ツール４４、６４又は７４を撮像した画像データを該学習モデルＬＭ２に入力して、ツール４４、６４又は７４の状態Ｓを判定してもよい。学習データ取得部１２は、力センサ３２から取得した力Ｆのデータと、オペレータ（又は学習モデルＬＭ２）によって定められた状態Ｓを示すデータとを、学習データセットＤＳとして取得する。

【0035】

ここで、ロボット２０がツール４４、６４又は７４に所定の動作を実行させているときにツール４４、６４又は７４からロボット２０に加わる力Ｆと、ツール４４、６４又は７４の状態Ｓ（正常状態、異常状態等）との間には、相関性がある。例えば、図２～図４に示す例において、ツール４４又は６４に損傷が生じていたとする。

【0036】

この場合にロボット２０がツール４４又は６４を回転させる所定の動作を行うと、損傷によってツール４４又は６４の回転に偏心が発生し、その結果、ツール４４又は６４からロボット２０に加わる力Ｆが、損傷がないツール４４又は６４を回転させた場合と比べて、異なり得る。

【0037】

また、図５及び図６に示す例において、ツール７４に損傷が生じていたとする。この場合にロボット２０がツール７４を穴Ｈに嵌入させる所定の動作を行うと、ツール７４の損傷箇所と穴Ｈの壁面との間で生じる摩擦等に起因して、ツール７４からロボット２０に加わる力Ｆが、損傷がないツール７４を穴Ｈに嵌入させた場合と比べて、異なり得る。

【0038】

学習部１４は、力Ｆ及び状態Ｓの学習データセットＤＳを用いて、力Ｆと状態Ｓとの相関性を表す学習モデル（関数）ＬＭを生成する。例えば、学習部１４は、教師あり学習を実行することで、学習モデルＬＭを生成する。この場合、新たなツール４４、６４又は７４をロボット２０に装着する毎に、ロボット２０に所定の動作を繰り返し試行させる。そして、学習データ取得部１２は、ロボット２０が所定の動作を実行する毎に、学習データセットＤＳを教師データとして繰り返し取得する。

【0039】

学習部１４は、教師データとして取得した力Ｆのデータ（時間変化特性、周波数スペクトラム等）と状態Ｓを示すデータ（正常状態、異常状態等のラベル情報）との相関性を暗示する特徴を識別することで、学習モデルＬＭを学習していく。このような教師あり学習として、例えば、サポートベクターマシン（ＳＶＭ）、又は混合ガウスモデル（ＧＭＭ）といったアルゴリズムを用いることができる。

【0040】

以下、図７を参照して、機械学習装置１０が行う学習サイクルのフローについて説明する。ステップＳ１において、オペレータは、ロボット２０にツール４４、６４又は７４（すなわち、エンドエフェクタ４０、５０、６０又は７０）を取り付け、ロボット２０でツール４４、６４又は７４に所定の動作を行わせる。

【0041】

ステップＳ２において、学習データ取得部１２は、学習データセットＤＳを取得する。具体的には、学習データ取得部１２は、ステップＳ１でロボット２０がツール４４、６４又は７４に所定の動作を行わせる間に力センサ３２が検出した力Ｆのデータを、該力センサ３２から取得する。

【0042】

また、学習データ取得部１２は、ステップＳ１で回転させたツール４４、６４又は７４の状態Ｓを示すデータとして、正常状態のラベル情報、又は異常状態のラベル情報を取得する。一例として、オペレータは、ステップＳ１で所定の動作を行う前にツール４４、６４又は７４を目視することで、該ツール４４、６４又は７４が正常状態であるか、又は異常状態であるかを確認する。

【0043】

他の例として、オペレータは、ステップＳ１で所定の動作を行っている間に力センサ３２が検出した力Ｆのデータを確認することで、該ツール４４が正常状態であるか、又は異常状態であるかを確認する。オペレータは、機械学習装置１０の入力装置を操作して、ステップＳ１で取り付けたツール４４、６４又は７４の状態Ｓを示すデータとして、正常状態のラベル情報、又は異常状態のラベル情報を入力する。

【0044】

さらに他の例として、ステップＳ１で所定の動作を実行する前、又は実行した後に、ツール４４、６４又は７４をカメラ（図示せず）で撮像する。そして、撮像した画像データを上記の学習モデルＬＭ２に入力する。学習モデルＬＭ２は、正常状態のラベル情報、又は異常状態のラベル情報を、学習データ取得部１２へ出力する。

【0045】

学習データ取得部１２は、入力された正常状態のラベル情報、又は異常状態のラベル情報を取得する。このようにして、学習データ取得部１２は、力Ｆのデータと状態Ｓを示すデータの学習データセットＤＳを取得し、互いに関連付けて記憶部に記憶する。

【0046】

ステップＳ３において、学習部１４は、ステップＳ２で取得した学習データセットＤＳを用いて、力Ｆと状態Ｓとの相関性を表す学習モデルＬＭを生成する。具体的には、学習部１４は、教師あり学習のアルゴリズム（ＳＶＭ、ＧＭＭ等）を実行することによって、学習モデルＬＭを学習する。

【0047】

そして、ステップＳ１に戻り、オペレータは、新たなツール４４、６４又は７４（すなわち、エンドエフェクタ４０、５０、６０又は７０）をロボット２０に取り付けて、ロボット２０は、該新たなツール４４、６４又は７４で所定の動作を行う。そして、ステップＳ２において、学習データ取得部１２は、該新たなツール４４、６４又は７４に関して学習データセットＤＳを取得し、ステップＳ３において、学習部１４は、新たに取得された学習データセットＤＳを用いて学習モデルＬＭを更新する。

【0048】

このような学習サイクルを実行することによって、学習モデルＬＭの学習が進行し、学習モデルＬＭが最適解へ導かれることになる。このような学習サイクルを、ツール４４、６４、及び７４の各々に関して実行することにより、ツール４４、６４、７４の状態Ｓと力Ｆとの相関性を表す学習モデルＬＭを、ツール４４、６４、及び７４のそれぞれに関して取得することができる。

【0049】

本実施形態によれば、力Ｆとツールの状態Ｓとの相関性を定量的に表すモデルを、自動的且つ正確に求めることができる。なお、図７に示す学習サイクルのフローに限らず、例えば、ステップＳ１及びＳ２のループを繰り返し実行して多数の学習データセットＤＳを取得した後に、ステップＳ３を実行し、学習部１４が、該多数の学習データセットＤＳを用いて学習モデルＬＭの学習を実行してもよい。

【0050】

なお、機械学習装置１０の他の機能として、ステップＳ２において、学習データ取得部１２は、ステップＳ１でロボット２０が所定の動作を行っているときのツール４４、６４又は７４の位置及び姿勢のデータを、学習データセットＤＳとしてさらに取得してもよい。具体的には、ステップＳ１でロボット２０は、ツール４４、６４又は７４を所定の位置及び姿勢に配置させた状態で、該ツール４４、６４又は７４に所定の動作を実行させる。

【0051】

そして、ステップＳ２で、学習データ取得部１２は、ステップＳ１でツール４４、６４又は７４を所定の位置及び姿勢に配置させたときに、ロボット２０の各サーボモータの回転角度θを検出するエンコーダ（図示せず）から、回転角度θを取得する。これら回転角度θから、ツール４４、６４又は７４（又は、エンドエフェクタ４０、５０、６０又は７０）の位置及び姿勢を算出できる。

【0052】

このステップＳ２において、学習データ取得部１２は、学習データセットＤＳとして、力Ｆのデータ及び状態Ｓを示すデータに加えて、ツール４４、６４又は７４の位置及び姿勢のデータをさらに取得する。なお、学習データ取得部１２は、位置及び姿勢のデータとして、回転角度θを取得してもよい。そして、ステップＳ３において、学習部１４は、力Ｆのデータと、状態Ｓのデータと、位置及び姿勢のデータとの学習データセットＤＳを用いて、学習モデルＬＭを生成する。

【0053】

学習データセットＤＳとして位置及び姿勢のデータを取得する意義について、以下に説明する。ロボット２０が所定の動作を実行しているときに力センサ３２が検出する力Ｆは、ツール４４、６４又は７４の位置及び姿勢に応じて変化する。したがって、ツール４４、６４又は７４の位置及び姿勢と力Ｆとの関連性を加味して学習モデルＬＭを生成することによって、ツール４４、６４又は７４を様々な位置及び姿勢に配置して所定の動作を実行したときの力Ｆと状態Ｓとの相関性を表す学習モデルＬＭを取得することができる。

【0054】

機械学習装置１０のさらに他の機能として、例えばツール４４又は６４を用いる場合、ステップＳ２において、学習データ取得部１２は、ステップＳ１でロボット２０が所定の動作を行っているときのツール４４又は６４の回転速度のデータを、学習データセットＤＳとしてさらに取得してもよい。

【0055】

具体的には、ステップＳ１でロボット２０がツール４４又は６４を回転させる所定の動作を行っているときに、学習データ取得部１２は、ツール４４又は６４の回転速度を検出する速度センサ（図示せず）から、回転速度Ｖのデータを取得する。

【0056】

代替的には、学習データ取得部１２は、ステップＳ１でロボット２０がツール４４又は６４に所定の動作を行わせるときにエンドエフェクタ４０、５０又は６０に送信される速度指令ＣＲのデータを取得してもよい。速度指令ＣＲは、所定の動作時におけるツール４４又は６４の回転速度を規定する指令である。

【0057】

一方、ツール７４を用いる場合、ステップＳ２において、学習データ取得部１２は、ステップＳ１でロボット２０が所定の動作を行っているときのツール７４の動作速度（すなわち、ツール７４が穴Ｈへ移動する速度）のデータを、学習データセットＤＳとしてさらに取得してもよい。具体的には、学習データ取得部１２は、ステップＳ１でロボット２０がツール７４を穴Ｈに嵌入させる所定の動作を行っているときに、該ツール７４の動作速度を検出する速度センサ（図示せず）から、動作速度Ｖを取得する。

【0058】

代替的には、学習データ取得部１２は、ステップＳ１でロボット２０がツール７４に所定の動作を行わせているときに該ツール７４に送信される速度指令ＣＲのデータを取得してもよい。速度指令ＣＲは、所定の動作時におけるツール７４の動作速度を規定する指令である。

【0059】

こうして、ステップＳ２において、学習データ取得部１２は、学習データセットＤＳとして、力Ｆのデータ及び状態Ｓを示すデータに加えて、ツール４４、６４又は７４の速度Ｖ（又は速度指令ＣＲ）のデータをさらに取得する。そして、ステップＳ３において、学習部１４は、力Ｆのデータと、状態Ｓのデータと、速度Ｖ（又は速度指令ＣＲ）との学習データセットＤＳを用いて、学習モデルＬＭを生成する。

【0060】

ここで、ロボット２０が所定の動作を実行しているときに力センサ３２が検出する力Ｆは、ツール４４、６４又は７４の速度Ｖに応じて変化する。したがって、ツール４４、６４又は７４の速度Ｖ（又は速度指令ＣＲ）と力Ｆとの関連性を加味して学習モデルＬＭを生成することによって、速度Ｖに応じた学習モデルＬＭを取得することができる。

【0061】

機械学習装置１０のさらに他の機能として、ステップＳ２において、学習データ取得部１２は、ツール４４、６４又は７４の重量ＷＧのデータを、学習データセットＤＳとしてさらに取得してもよい。具体的には、ステップＳ１で所定の動作を実行する前、又は実行した後に、学習データ取得部１２は、ツール４４、６４又は７４の重量を検出する重量センサ（図示せず）から、重量ＷＧのデータを取得する。

【0062】

こうして、ステップＳ２において、学習データ取得部１２は、学習データセットＤＳとして、力Ｆのデータ及び状態Ｓを示すデータに加えて、ツール４４、６４又は７４の重量ＷＧのデータをさらに取得する。そして、ステップＳ３において、学習部１４は、力Ｆのデータと、状態Ｓのデータと、重量ＷＧのデータとの学習データセットＤＳを用いて、学習モデルＬＭを生成する。

【0063】

ここで、ロボット２０が所定の動作を実行しているときに力センサ３２が検出する力Ｆは、ツール４４、６４又は７４の重量ＷＧに応じて変化する。したがって、ツール４４、６４又は７４の重量ＷＧと力Ｆとの関連性を加味して学習モデルＬＭを生成することによって、重量ＷＧに応じた学習モデルＬＭを取得することができる。

【0064】

機械学習装置１０のさらに他の機能として、ステップＳ２において、学習データ取得部１２は、ツール４４、６４又は７４の作業対象となるワークＷの種類のデータを、学習データセットＤＳとしてさらに取得してもよい。ワークＷの種類のデータは、ワークＷの材料、粗さ、又は剛性率等のワークＷの仕様に関する情報、又は、ワークＷの種類を識別する情報等を含む。

【0065】

ワークＷの仕様に関する情報は、文字（「鉄」、「アルミ」、「ＳＵＳ３０４４」等）、又は数値を含んでもよい。また、ワークＷの種類を識別する情報は、「ワークタイプＡ」、「ワークタイプＢ」といった文字情報であってもよいし、又は、オペレータがワークＷ毎に付す識別番号であってもよい。

【0066】

例えば、オペレータは、ステップＳ２において、機械学習装置１０の入力装置を操作して、ワークＷの種類のデータを入力する。こうして、ステップＳ２において、学習データ取得部１２は、学習データセットＤＳとして、力Ｆのデータ及び状態Ｓを示すデータに加えて、ワークＷの種類のデータをさらに取得する。そして、ステップＳ３において、学習部１４は、力Ｆのデータと、状態Ｓのデータと、ワークＷの種類のデータとの学習データセットＤＳを用いて、学習モデルＬＭを生成する。

【0067】

ここで、ロボット２０が所定の動作を実行しているときに力センサ３２が検出する力Ｆは、ワークＷの種類のデータに応じて変化する。例えば、ステップＳ１でロボット２０がツール４４又は６４をワークＷに接触させて回転させる所定動作を行う場合、又は、ロボット２０がツール７４を穴Ｈに嵌入させる所定動作を行う場合、ワークＷの材料、粗さ、又は剛性率等によって、ワークＷからツール４４又は６４に掛かる力は変動し得る。

【0068】

したがって、ワークＷの種類と力Ｆとの関連性を加味して学習モデルＬＭを生成することによって、ワークＷの種類に応じた学習モデルＬＭを取得することができる。なお、学習データ取得部１２は、ツール４４、６４又は７４の種類のデータ（ツールの種類を識別する文字情報等）を、学習データセットＤＳとしてさらに取得してもよい。

【0069】

なお、ツール４４、６４又は７４は、状態Ｓが経時で変化する既知の耐用期間Ｔを有している。この耐用期間とは、例えば１ヶ月又は１年というように、ツール４４、６４又は７４の仕様として予め定められ得る。このような耐用期間が有る場合において、学習部１４は、耐用期間Ｔに含まれる複数の小期間の各々について、学習モデルＬＭを生成してもよい。

【0070】

例えば、耐用期間Ｔを、ツール４４、６４又は７４が新品の時点ｔ_０から、ツール４４、６４又は７４を所定時間使用した後の時点ｔ_１までの小期間Ｔ_１と、時点ｔ_１から、ツール４４、６４又は７４を所定時間さらに使用した後の時点ｔ_２までの小期間Ｔ_２と、・・・時点ｔ_ｎ－１から、ツール４４、６４又は７４を所定時間さらに使用した後の時点ｔ_ｎまでの小期間Ｔ_ｎとに区切る。

【0071】

この場合において、学習部１４は、小期間Ｔ_ｎ（ｎ＝１、２、３、・・・ｎ）の各々において、図７に示す学習サイクルを実行し、小期間Ｔ_ｎ毎に学習モデルＬＭ_ｎを生成してもよい。この構成によれば、ツール４４、６４、７４の使用期間に応じた学習モデルＬＭを生成できる。

【0072】

なお、学習部１４が実行する学習アルゴリズムは、教師あり学習に限定されず、例えば教師なし学習、強化学習、ニューラルネットワーク等、機械学習として公知の学習アルゴリズムを採用できる。一例として、図８は、ニューロンのモデルを模式的に示す。図９は、図８に示すニューロンを組み合わせて構成した三層のニューラルネットワークのモデルを模式的に示す。なお、図８は、一例として入力ｘが３つである場合を示しているが、入力ｘの数は、ｎ（ｎは、２又は４以上の正数）であってもよい。また、図９は、一例として、三層のニューラルネットワークのモデルを示しているが、ｎ層（ｎは、２又は４以上の正数）のニューラルネットワークを用いてもよい。ニューラルネットワークは、例えば、ニューロンのモデルを模した演算装置や記憶装置等によって構成できる。

【0073】

図８に示すニューロンは、複数の入力ｘ（図では例として入力ｘ１～ｘ３）に対し結果ｙを出力する。個々の入力ｘ（ｘ１、ｘ２、ｘ３）にはそれぞれに重みｗ（ｗ１、ｗ２、ｗ３）が乗算される。入力ｘと結果ｙとの関係は、下記の式１で表すことができる。なお、入力ｘ、結果ｙ及び重みｗはいずれもベクトルである。また式１において、θはバイアスであり、ｆ_ｋは活性化関数である。

【0074】

【数1】

【0075】

図９に示す三層のニューラルネットワークは、左側から複数の入力ｘ（図では例として入力ｘ１～入力ｘ３）が入力され、右側から結果ｙ（図では例として結果ｙ１～結果ｙ３）が出力される。図示の例では、入力ｘ１、ｘ２、ｘ３のそれぞれに対応の重み（総称してＷ１で表す）が乗算されて、個々の入力ｘ１、ｘ２、ｘ３がいずれも３つのニューロンＮ１１、Ｎ１２、Ｎ１３に入力されている。

【0076】

図９では、ニューロンＮ１１～Ｎ１３の各々の出力を、総称してＺ１で表す。Ｚ１は、入力ベクトルの特徴量を抽出した特徴ベクトルと見なすことができる。図示の例では、特徴ベクトルＺ１のそれぞれに対応の重み（総称してＷ２で表す）が乗算されて、個々の特徴ベクトルＺ１がいずれも２つのニューロンＮ２１、Ｎ２２に入力されている。特徴ベクトルＺ１は、重みＷ１と重みＷ２との間の特徴を表す。

【0077】

図９では、ニューロンＮ２１～Ｎ２２の各々の出力を、総称してＺ２で表す。Ｚ２は、特徴ベクトルＺ１の特徴量を抽出した特徴ベクトルと見なすことができる。図示の例では、特徴ベクトルＺ２のそれぞれに対応の重み（総称してＷ３で表す）が乗算されて、個々の特徴ベクトルＺ２がいずれも３つのニューロンＮ３１、Ｎ３２、Ｎ３３に入力されている。

【0078】

特徴ベクトルＺ２は、重みＷ２と重みＷ３との間の特徴を表す。最後にニューロンＮ３１～Ｎ３３は、それぞれ結果ｙ１～ｙ３を出力する。機械学習装置１０は、学習データセットＤＳを入力とし、上記したニューラルネットワークに従う多層構造の演算を行うことで、学習モデルＬＭを学習することができる。

【0079】

上述した機械学習装置１０の構成は、コンピュータのプロセッサが実行する機械学習方法（又はソフトウェア）として記述できる。この機械学習方法は、ロボット２０がツール４４、６４又は７４に所定の動作を行わせている間に該ツール４４、６４又は７４からロボット２０に加わる力Ｆのデータと、該所定の動作を行っているときのツール４４、６４又は７４の状態Ｓを示すデータとを学習データセットＤＳとして取得し、学習データセットＤＳを用いて、力Ｆとツールの状態Ｓとの相関性を表す学習モデルＬＭを生成する。

【0080】

次に、図１０を参照して、一実施形態に係るロボットシステム１００について説明する。ロボットシステム１００は、ロボット２０、力センサ３２、及び制御装置１０２を備える。制御装置１０２は、プロセッサ１０４、及び記憶部１０６を有する。プロセッサ１０４と記憶部１０６とは、バス１０８を介して互いに通信可能に接続され、プロセッサ１０４は、ＣＰＵ又はＧＰＵ等を含み、記憶部１０６と通信しつつ各種演算を実行する。

【0081】

本実施形態においては、機械学習装置１０は、ハードウェア又はソフトウェアとして制御装置１０２に実装されており、プロセッサ１０４は、機械学習装置１０の機能を果たすための各種演算を実行する。すなわち、本実施形態においては、プロセッサ１０４は、学習データ取得部１２及び学習部１４として機能する。記憶部１０６は、ＲＯＭ及びＲＡＭ等を含み、機械学習装置１０が学習した学習モデルＬＭを予め格納している。

【0082】

次に、図１１を参照して、ロボットシステム１００の動作について説明する。図１１に示すフローは、プロセッサ１０４が、オペレータ、上位コントローラ、又は作業プログラムから作業開始指令を受け付けたときに、開始する。ステップＳ１１において、プロセッサ１０４は、ロボット２０の動作を開始する。このステップＳ１１において、プロセッサ１０４はロボット２０に、学習モデルＬＭの学習段階で実行した「所定の動作」と同じ動作を行わせる。

【0083】

例えば、図２～図４に示す例の場合、プロセッサ１０４はロボット２０に、ツール４４又は６４をワークに接触させずに（又は接触させて）回転させる動作を行わせる。また、図５及び図６に示す例の場合、プロセッサ１０４はロボット２０に、エンドエフェクタ７０で把持したツール７４を穴Ｈに嵌入する動作を行う。なお、ツール４４若しくは６４をワークに接触させて回転させる動作、又は、ツール７４を穴Ｈに嵌入する動作を行っているときに、プロセッサ１０４は、上述の力制御を実行してもよい。

【0084】

なお、このステップＳ１１で実行する「同じ動作」とは、学習モデルＬＭの学習段階で実行した「所定の動作」と完全に同じ条件（ツールの種類、ワークの種類、ロボット２０の種類、ロボット２０の位置及び姿勢、ロボット２０の移動経路等）の動作に限らず、条件のうちの少なくとも１つが「所定の動作」と異なる動作も含み得る。

【0085】

ステップＳ１２において、プロセッサ１０４は、力Ｆのデータの取得を開始する。具体的には、プロセッサ１０４は、ステップＳ１１の動作を実行している間に力センサ３２が検出した力Ｆのデータを、該力センサ３２から取得する動作を開始する。ここで、プロセッサ１０４は、ステップＳ１１の動作を実行している間の所定の時間τに亘って、力Ｆのデータを取得してもよい。

【0086】

この所定の時間τは、ステップＳ１１でロボット２０が行う動作の始期から終期までの時間であってもよいし、又は、該動作中の任意の時間（例えば、１秒）であってもよい。また、図７に示す学習サイクルでツール４４、６４又は７４の位置及び姿勢のデータをさらに取得して学習モデルＬＭの学習を行った場合、プロセッサ１０４は、このステップＳ１２で、力センサ３２が力Ｆを検出したときのツール４４、６４又は７４の位置及び姿勢のデータを取得し、取得した力Ｆのデータと関連付けて記憶部１０６に記憶してもよい。

【0087】

また、図７に示す学習サイクルでツール４４、６４又は７４の速度Ｖのデータをさらに取得して学習モデルＬＭの学習を行った場合、速度センサは、ステップＳ１１の実行中にツール４４、６４又は７４の速度Ｖ（又は速度指令ＣＲ）を検出し、プロセッサ１０４は、このステップＳ１２で、該速度センサから速度Ｖのデータを取得する。

【0088】

また、図７に示す学習サイクルでツール４４、６４又は７４の重量ＷＧのデータをさらに取得して学習モデルＬＭの学習を行った場合、プロセッサ１０４は、ツール４４、６４又は７４の重量ＷＧのデータを、重量センサから取得する。また、図７に示す学習サイクルでワーク（又はツール）の種類のデータをさらに取得して学習モデルＬＭの学習を行った場合、プロセッサ１０４は、ワーク（又はツール）の種類のデータを、オペレータから入力装置を通して取得する。

【0089】

ステップＳ１３において、プロセッサ１０４は、学習モデルＬＭに基づいて、ツール４４、６４又は７４の状態Ｓを判定する。具体的には、プロセッサ１０４は、ステップＳ１２で取得した力Ｆのデータを、記憶部１０６に格納している学習モデルＬＭに入力する。そうすると、学習モデルＬＭは、入力された力Ｆのデータと相関性を有する状態Ｓのデータ（「正常状態」、「異常状態」等のラベル情報）を推定して出力する。こうして、プロセッサ１０４は、取得した力Ｆのデータから、ツール４４、６４、７４の状態Ｓを判定することができる。

【0090】

なお、学習データセットＤＳとしてツール４４、６４又は７４の位置及び姿勢のデータを用いて学習モデルＬＭを生成している場合、プロセッサ１０４は、力Ｆのデータとともに、ステップＳ１２で取得したツール４４、６４又は７４の位置及び姿勢のデータを学習モデルＬＭに入力してもよい。この場合、学習モデルＬＭは、ツール４４、６４又は７４の位置及び姿勢に対応する力Ｆのデータと相関性を有する状態Ｓのデータを推定して出力する。

【0091】

また、学習データセットＤＳとして、ツール４４、６４又は７４の速度Ｖ（又は速度指令ＣＲ）、重量ＷＧ、若しくはワーク（又はツール）の種類のデータを用いて学習モデルＬＭを生成している場合、プロセッサ１０４は、力Ｆのデータとともに、速度Ｖ（又は速度指令ＣＲ）、重量ＷＧ、若しくは種類のデータを学習モデルＬＭに入力してもよい。この場合、学習モデルＬＭは、力Ｆのデータと、速度Ｖ（又は速度指令ＣＲ）、重量ＷＧ、又は種類のデータとから、状態Ｓのデータを推定して出力する。

【0092】

このように、力Ｆのデータに加えて、より多くのデータを用いて学習モデルＬＭを生成することにより、図１１に示すフローでツール４４、６４又は７４の異常を判定する段階において、より多くの条件（位置及び姿勢、速度Ｖ、重量ＷＧ、ワーク又はツールの種類）に対応して、ツール４４、６４又は７４の異常を判定することが可能となる。

【0093】

プロセッサ１０４は、ツール４４、６４又は７４の状態Ｓが異常状態ではない（又は、正常状態である）場合にＮＯと判定し、ステップＳ１１で開始した動作を完了させ、図１１に示すフローを終了する。一方、プロセッサ１０４は、ツール４４、６４又は７４の状態Ｓが異常状態である（又は、正常状態ではない）場合にＹＥＳと判定し、ステップＳ１５へ進む。このように、本実施形態においては、プロセッサ１０４は、ツール４４、６４又は７４の状態Ｓを判定する状態判定部１１０（図１０）として機能する。

【0094】

ステップＳ１５において、プロセッサ１０４は、力センサ３２の故障の有無を検知する。ここで、仮に力センサ３２が故障していた場合、適切な力のデータＦをプロセッサ１０４に供給することができず、これにより、ツール４４、６４又は７４の状態Ｓが正常状態であるにも関わらず、ステップＳ１３で状態Ｓが異常状態である（すなわちＹＥＳ）と判定され得る。

【0095】

状態Ｓの判定の正誤を識別すべく、本実施形態においては、プロセッサ１０４は、このステップＳ１５を実行する。具体的には、プロセッサ１０４は、ステップＳ１１で開始した動作を停止し、ツール４４、６４又は７４（すなわち、エンドエフェクタ４０、５０、６０又は７０）を、予め定められた位置及び姿勢に配置させる。

【0096】

そして、プロセッサ１０４は、このときに力センサ３２が検出した力Ｆ_０を、該力センサ３２から取得する。そして、プロセッサ１０４は、取得した力Ｆ_０が、予め定められた基準値Ｆ_αと異なっているか否かを判定する。ここで、静止状態のツール４４、６４又は７４を予め定められた位置及び姿勢に配置したときに該ツール４４、６４又は７４からロボット２０に加わる力は、計測又はシミュレーション等によって、推定することができる。したがって、このように推定された力を、基準値Ｆ_αとして、記憶部１０６に予め記憶することができる。

【0097】

プロセッサ１０４は、取得した力Ｆ_０が基準値Ｆ_αと異なっている（すなわち、ＹＥＳ）と判定した場合、ステップＳ１７へ進む一方、取得した力Ｆ_０が基準値Ｆ_αと実質同じである（すなわち、ＮＯ）と判定した場合、ステップＳ１６へ進む。例えば、プロセッサ１０４は、このステップＳ１５において、力Ｆ_０と基準値Ｆ_αとの差（＝｜Ｆ_０－Ｆ_α｜）が、予め定められた閾値よりも大きい場合に、ＹＥＳと判定してもよい。このように、本実施形態においては、プロセッサ１０４は、力センサ３２の故障の有無を検知する故障検知部１１２（図１０）として機能する。

【0098】

なお、オペレータは、ツール４４、６４又は７４の位置及び姿勢と、力センサ３２が検出する力Ｆの状態（正常値、異常値）との相関性を表す学習モデルＬＭ３を予め準備してもよい。そして、プロセッサ１０４は、このステップＳ１５でツール４４、６４又は７４を予め定められた位置及び姿勢させたときの該ツール４４、６４又は７４の位置及び姿勢のデータと、このときに力センサ３２が検出した力Ｆ_０とを該学習モデルＬＭ３に入力し、力センサ３２の故障の有無を検知してもよい。

【0099】

また、例えばツール４４又は６４を用いる場合において、力センサ３２は、ツール４４又は６４をワークに接触させずに回転させる動作を行っているときに力Ｆ_０’を検出してもよい。ツール４４又は６４をワークに接触させずに回転させているときに該ツール４４、６４又は７４からロボット２０に加わる力も、計測又はシミュレーション等によって、推定することができる。したがって、プロセッサ１０４は、このように推定された力を、基準値Ｆ_α’とし、このステップS１５において、力センサ３２によって検出された力Ｆ_０’が基準値Ｆ_α’と異なっているか否かを判定してもよい。

【0100】

ステップＳ１６において、プロセッサ１０４は、第１の警告信号を生成する。例えば、プロセッサ１０４は、「ツールに異常が発生している可能性があります」という音声又は画像の信号を生成し、制御装置１０２に設けられたスピーカ又はディスプレイ（図示せず）を通して出力する。そして、プロセッサ１０４は、図１１に示すフローを終了する。

【0101】

ステップＳ１７において、プロセッサ１０４は、第２の警告信号を生成する。例えば、プロセッサ１０４は、「力センサに異常が発生している可能性があります」という音声又は画像の信号を生成し、制御装置１０２に設けられたスピーカ又はディスプレイを通して出力する。そして、プロセッサ１０４は、図１１に示すフローを終了する。

【0102】

以上のように、本実施形態においては、プロセッサ１０４は、ロボット２０がツール４４、６４又は７４を用いて作業を行っているときに、機械学習装置１０が学習した学習モデルＬＭに基づいてツール４４、６４又は７４の状態Ｓを判定している。この構成によれば、ツール４４、６４又は７４に異常が発生しているか否かを、作業中に取得した力Ｆのデータから自動的且つ高精度に判定することができる。

【0103】

また、本実施形態においては、プロセッサ１０４は、ツール４４、６４又は７４の状態Ｓが異常状態であると判定したときに、力センサ３２の故障の有無を検知している。この構成によれば、オペレータがツール４４、６４又は７４の状態Ｓを誤認してしまうのを防止することができるとともに、力センサ３２の故障を特定できる。

【0104】

なお、ロボットシステム１００から、故障検知部１１２の機能を削除することもできる。この場合、図１１に示すフローからステップＳ１５及びＳ１７が削除され、プロセッサ１０４は、ステップＳ１３でＹＥＳと判定した場合に、ステップＳ１６へ進む。また、ロボットシステム１００の記憶部１０６は、制御装置１０２とは別の装置（外付けメモリ、外部サーバ、クラウド等）として設けられてもよい。

【0105】

また、上述の実施形態においては、プロセッサ１０４は、ステップＳ１３でＹＥＳと判定した場合に、力センサ３２の故障の有無を判定するプロセス（ステップＳ１５）を実行する場合について述べたが、ステップＳ１３でＮＯと判定した場合に、力センサ３２の故障の有無を判定するプロセスを実行し、該力センサ３２の故障があると判定した場合にステップＳ１７へ進んでもよい。

【0106】

また、力センサ３２は、ロボット２０の如何なる位置に設けられてもよい。例えば、力センサ３２は、ロボットのベース部２２に設置されてもよい。また、力センサ３２は、６軸力覚センサに限らず、例えば、ロボット２０に内蔵された複数のサーボモータにそれぞれ設けられた複数のトルクセンサから構成されてもよい。この場合、トルクセンサは、対応するサーボモータに掛かるトルクを力Ｆとして検出し、力Ｆのデータを学習データ取得部１２に供給する。

【0107】

また、上述の実施形態においては、研磨作業、切削加工、及び嵌入作業のためのツール４４、６４、及び７４（エンドエフェクタ４０、５０、６０、及び７０）について述べたが、他の如何なる作業（例えば、スポット溶接）を行うためのツール（スポット溶接ガン）をロボット２０に取り付けてもよい。また、ロボットは、垂直多関節型ロボットに限らず、水平多関節ロボット、又はパラレルリンクロボット等、如何なるタイプのロボットであってもよい。また、ロボットは、天井吊り下げタイプ、又は、壁掛けタイプのロボットであってもよい。

【0108】

また、図１０に示す実施形態においては、制御装置１０２のプロセッサ１０４が、学習データ取得部１２及び学習部１４として機能する場合について述べた。しかしながら、これに限らず、例えば、学習部１４が、制御装置１０２とは別のコンピュータに実装されてもよい。

【0109】

この場合、該別のコンピュータは、制御装置１０２と通信可能に接続され、制御装置１０２のプロセッサ１０４が学習データ取得部１２として取得した学習データセットＤＳを、該別のコンピュータに送信し、学習部１４が、制御装置１０２から取得した学習データセットＤＳを用いて学習モデルＬＭを生成する。又は、学習データ取得部１２及び学習部１４を備える機械学習装置１０が、該別のコンピュータに実装されてもよい。この場合、該別のコンピュータは、学習データ取得部１２として機能して、力センサ３２から力Ｆのデータを取得する。

【0110】

以上、実施形態を通じて本開示を説明したが、上述の実施形態は、特許請求の範囲に係る発明を限定するものではない。

【符号の説明】

【0111】

１０機械学習装置
１２学習データ取得部
１４学習部
２０ロボット
３２力センサ
４４，６４，７４ツール
１００ロボットシステム
１０２制御装置
１０４プロセッサ
１１０状態判定部
１１２故障検知部

【図1】