特開2023-126079 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 株式会社デンソーウェーブの特許一覧 ▶ インテグラルエーアイインクの特許一覧

特開2023-126079学習モデル生成方法、学習モデル生成プログラム、学習モデル生成装置、学習用データ生成方法、学習用データ生成プログラム、学習用データ生成装置、推論方法、推論プログラム、推論装置、秤量方法、及び秤量システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023126079

(43)【公開日】2023-09-07

(54)【発明の名称】学習モデル生成方法、学習モデル生成プログラム、学習モデル生成装置、学習用データ生成方法、学習用データ生成プログラム、学習用データ生成装置、推論方法、推論プログラム、推論装置、秤量方法、及び秤量システム

(51)【国際特許分類】

B25J 13/00 20060101AFI20230831BHJP

G06N 3/02 20060101ALI20230831BHJP

G06N 20/00 20190101ALI20230831BHJP

【ＦＩ】

B25J13/00 Z

G06N3/02

G06N20/00

【審査請求】有

【請求項の数】13

【出願形態】ＯＬ

(21)【出願番号】P 2022103527

(22)【出願日】2022-06-28

(31)【優先権主張番号】17/682,339

(32)【優先日】2022-02-28

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】501428545

【氏名又は名称】株式会社デンソーウェーブ

(71)【出願人】

【識別番号】522259119

【氏名又は名称】インテグラルエーアイインク

【氏名又は名称原語表記】ＩＮＴＥＧＲＡＬＡＩＩＮＣ．

(74)【代理人】

【識別番号】110000567

【氏名又は名称】弁理士法人サトー

(72)【発明者】

【氏名】山本洋介

(72)【発明者】

【氏名】ジャドタリフィ

【テーマコード（参考）】

3C707

【Ｆターム（参考）】

3C707AS01

3C707BS12

3C707BT05

3C707CT05

3C707CV08

3C707CW09

3C707CX09

3C707DS01

3C707HS27

3C707KS09

3C707KS21

3C707KS22

3C707KS37

3C707KV01

3C707LV23

3C707LW12

3C707LW15

3C707MT09

(57)【要約】

【課題】ロボットアームで液体を含む流体を秤量する際の制御に機械学習を取り入れたものにおいて機械学習の手法に関して改善を図る。
【解決手段】学習モデル生成方法は、対象流体を収容した第１容器を保持して第１容器から第２容器に対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、第２容器の時系列の重量と、を含む学習用データを複数取得し、学習用データを用いて、第１時刻におけるロボットアームの姿勢に関する情報及び第２容器の重量を入力とし、第２時刻におけるロボットアームの姿勢に関する情報を出力とする学習モデルを生成する。
【選択図】図３

【特許請求の範囲】

【請求項1】

対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を含む学習用データを複数取得し、
前記学習用データを用いて、第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習モデルを生成する、
学習モデル生成方法。

【請求項2】

前記学習用データは、前記ロボットアームに作用する負荷に関する情報を含んでいる、
請求項１に記載の学習モデル生成方法。

【請求項3】

前記学習用データは、前記ロボットアームに作用する負荷に関する情報として、前記ロボットアームの各軸のモータの電流値を含んでいる、
請求項２に記載の学習モデル生成方法。

【請求項4】

コンピュータに、
対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を含む学習用データを複数取得する処理と、
前記学習用データを用いて、第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習モデルを生成する処理と、
を実行させるための学習モデル生成プログラム。

【請求項5】

対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を含む学習用データを複数取得する学習用データ取得部と、
前記学習用データを用いて、第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習モデルを生成する学習処理部と、
を備える学習モデル生成装置。

【請求項6】

対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報を取得する処理と、
前記第２容器の時系列の重量を取得する処理と、
前記ロボットアームの姿勢に関する時系列の情報と前記第２容器の時系列の重量とを対応付ける処理と、
を含む学習用データ生成方法。

【請求項7】

コンピュータに、
対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を取得する処理と、
前記ロボットアームの姿勢に関する情報と前記第２容器の重量とを取得時刻で対応付けた学習用データを生成する処理と、
を実行させるための学習用データ生成プログラム。

【請求項8】

対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する情報と、前記第２容器の重量とを取得する状態データ取得部と、
前記ロボットアームの姿勢に関する情報と前記第２容器の重量とを取得時刻で対応付けた学習用データを生成する学習用データ生成処理部と、
を備える学習用データ生成装置。

【請求項9】

対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ場合に、
第１時刻における前記ロボットアームの姿勢に関する情報を取得し、
前記第１時刻における前記第２容器の重量を取得し、
前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する、
推論方法。

【請求項10】

対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ場合に、
コンピュータに、
第１時刻における前記ロボットアームの姿勢に関する情報を取得する処理と、
前記第１時刻における前記第２容器の重量を取得する処理と、
前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する処理と、
を実行させるための推論プログラム。

【請求項11】

対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ場合において、
第１時刻における前記ロボットアームの姿勢に関する情報と、前記第１時刻における前記第２容器の重量と、を取得する状態データ取得部と、
前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する推論処理部と、
を備える推論装置。

【請求項12】

対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ方法であって、
第１時刻における前記ロボットアームの姿勢に関する情報を取得し、
前記第１時刻における前記第２容器の重量を取得し、
前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力し、
前記第２時刻における前記ロボットアームの姿勢に関する情報に基づいて前記ロボットアームの動作を制御する、
秤量方法。

【請求項13】

対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する情報と、前記第２容器の重量とを取得する状態データ取得部と、
第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する学習処理部と、
前記第２時刻における前記ロボットアームの姿勢に関する情報に基づいて前記ロボットアームの動作を制御する制御装置と、
を備える秤量システム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、学習モデル生成方法、学習モデル生成プログラム、学習モデル生成装置、学習用データ生成方法、学習用データ生成プログラム、学習用データ生成装置、推論方法、推論プログラム、推論装置、秤量方法、及び秤量システムに関する。

【背景技術】

【0002】

従来では人が行っていた作業をロボットに代わりに行わせる技術の開発が近年行われている。そのような技術に、例えば容器に入った液体を指定された量だけ他の容器に移し替えるといった秤量処理を、ロボットアームと機械学習を用いて自動で行うものがある。しかしながら、従来構成においては、機械学習の手法等に関して未だ改善の余地がある。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２１－１６４９８０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

本開示の目的は、ロボットアームで液体を含む流体を秤量する際の制御に機械学習を取り入れたものにおいて機械学習の手法に関して改善を図った、学習モデル生成方法、学習モデル生成プログラム、学習モデル生成装置、学習用データ生成方法、学習用データ生成プログラム、学習用データ生成装置、推論方法、推論プログラム、推論装置、秤量方法、及び秤量システムを提供することにある。

【課題を解決するための手段】

【0005】

実施形態による学習モデル生成方法は、対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を含む学習用データを複数取得し、前記学習用データを用いて、第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習モデルを生成する。

【0006】

実施形態による学習モデル生成プログラムは、コンピュータに、対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を含む学習用データを複数取得する処理と、前記学習用データを用いて、第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習モデルを生成する処理と、を実行させる。

【0007】

実施形態による学習モデル生成装置は、対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を含む学習用データを複数取得する学習用データ取得部と、前記学習用データを用いて、第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習モデルを生成する学習処理部と、を備える。

【0008】

実施形態による学習用データ生成方法は、対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報を取得する処理と、前記第２容器の時系列の重量を取得する処理と、前記ロボットアームの姿勢に関する時系列の情報と前記第２容器の時系列の重量とを対応付ける処理と、を含む。

【0009】

実施形態による学習用データ生成プログラムは、コンピュータに、対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する時系列の情報と、前記第２容器の時系列の重量と、を取得する処理と、前記ロボットアームの姿勢に関する情報と前記第２容器の重量とを取得時刻で対応付けた学習用データを生成する処理と、を実行させる。

【0010】

実施形態による学習用データ生成装置は、対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する情報と、前記第２容器の重量とを取得する状態データ取得部と、前記ロボットアームの姿勢に関する情報と前記第２容器の重量とを取得時刻で対応付けた学習用データを生成する学習用データ生成処理部と、を備える。

【0011】

実施形態による推論方法は、対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ場合に、第１時刻における前記ロボットアームの姿勢に関する情報を取得し、前記第１時刻における前記第２容器の重量を取得し、前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する。

【0012】

実施形態による推論プログラムは、対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ場合に、コンピュータに、第１時刻における前記ロボットアームの姿勢に関する情報を取得する処理と、前記第１時刻における前記第２容器の重量を取得する処理と、前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する処理と、を実行させる。

【0013】

実施形態による推論装置は、対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ場合において、第１時刻における前記ロボットアームの姿勢に関する情報と、前記第１時刻における前記第２容器の重量と、を取得する状態データ取得部と、前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する推論処理部と、を備える。

【0014】

実施形態による秤量方法は、対象流体を収容した第１容器をロボットアームが保持して前記第１容器から第２容器に前記対象流体を注ぐ方法であって、第１時刻における前記ロボットアームの姿勢に関する情報を取得し、前記第１時刻における前記第２容器の重量を取得し、前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力し、前記第２時刻における前記ロボットアームの姿勢に関する情報に基づいて前記ロボットアームの動作を制御する。

【0015】

実施形態による秤量システムは、対象流体を収容した第１容器を保持して前記第１容器から第２容器に前記対象流体を注ぐ際のロボットアームの姿勢に関する情報と、前記第２容器の重量とを取得する状態データ取得部と、第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力とし、第２時刻における前記ロボットアームの姿勢に関する情報を出力とする学習用データを用いて学習させた学習モデルに、取得した前記第１時刻における前記ロボットアームの姿勢に関する情報及び前記第２容器の重量を入力して、前記第２時刻における前記ロボットアームの姿勢に関する情報を出力する学習処理部と、前記第２時刻における前記ロボットアームの姿勢に関する情報に基づいて前記ロボットアームの動作を制御する制御装置と、を備える。

【図面の簡単な説明】

【0016】

【図1】一実施形態による秤量システムの構成の一例を概念的に示す図

【図2】一実施形態によるロボットアームの構成の一例を概念的に示す図

【図3】一実施形態による秤量システムの構成の一例を機能ブロックを用いて概念的に示す図

【図4】一実施形態による情報処理装置のハードウェア構成の一例を概念的に示す図

【図5】一実施形態における学習用データの一例を概念的に示す図

【図6】一実施形態において学習用データを生成するための制御内容の一例を示すフローチャート

【図7】一実施形態における学習モデルの一例を概念的に示す図

【図8】一実施形態において秤量処理を実行するための制御内容の一例を示すフローチャート

【発明を実施するための形態】

【0017】

以下、一実施形態について図面を参照しながら説明する。
本実施形態の秤量システム１は、機械学習に基づいてロボットアーム１０の制御することで、第１容器９１から第２容器９２に指定量の流体を注ぎ移し替える秤量処理を実行可能なシステムである。本実施形態の秤量システム１は、第１容器９１の内容物を注ぐ際のロボットアーム１０の動作と、そのロボットアーム１０の動作により変化する第２容器９２の重量つまり第２容器９２に注がれる流体の重量との関係を機械学習し、その機械学習で得られた学習モデルを用いて、例えばユーザが指定した目標とする秤量値となるようにロボットアーム１０を自動で動作させるものである。

【0018】

ロボットアーム１０は、第１容器９１を例えば把持などして保持可能に構成されている。そして、ロボットアーム１０は、保持した第１容器９１を第２容器９２の近傍まで搬送し、第２容器９２に対して第１容器９１を傾けることで、第１容器９１内に収容されている流体を第２容器９２内に注いで移し替える。これにより、秤量システム１は、第１容器９１内に収容されている流体の所定量の秤量を行う。

【0019】

なお、本明細書において、第１容器９１及び第２容器９２の形状、サイズ、色、及び重量は、特定の構成に限定されない。秤量システム１が秤量の対象とする流体は、液体に限られず、流動性を有する粉体や粒体であっても良い。液体を秤量の対象とする場合、液体の色や粘度は特に限定されない。秤量を行う時点で第１容器９１及び第２容器９２内に収容されている流体の量も特に限定されない。また、本明細書において、第１容器９１又は第２容器９２の重量という場合は、第１容器９１又は第２容器９２内に収容されている流体の重量も含むものとする。

【0020】

秤量システム１は、図１に示すように、ロボットアーム１０、制御装置２０、計量器３０、及び情報処理装置４０を備える。なお、本実施形態の秤量システム１は、ロボットアーム１０の制御及び機械学習に画像又は映像情報を利用しない。そのため、本実施形態の秤量システム１は、カメラ等の光学機器を含まずに構成することができる。また、ロボットアーム１０は、第１容器９１を保持して傾けることで第１容器９１内に収容されている流体を第２容器９２内に注ぐことができるものであれば良い。ロボットアーム１０は、例えば水平多関節型のロボットアームやパラレルリンク側のロボットアーム、直交型のロボットアーム等であっても良い。

【0021】

ロボットアーム１０は、図２に示すように、例えば６軸を有する垂直多関節ロボットで構成することができる。ロボットアーム１０は、ベース１１と、複数この場合６つのアーム１２１～１２６と、を有している。各アーム１２１～１２６は、ベース１１上に順に設けられている。本実施形態の場合、ベース１１側から順に、第１アーム１２１、第２アーム１２２、第３アーム１２３、第４アーム１２４、第５アーム１２５、及び第６アーム１２６と称する。

【0022】

各アーム１２１～１２６は、それぞれ複数の軸Ｊ１～Ｊ６を介して回転可能に連結されている。この場合、ベース１１側から順に、第１軸Ｊ１、第２軸Ｊ２、第３軸Ｊ３、第４軸Ｊ４、第５軸Ｊ５、及び第６軸Ｊ６と称する。なお、各軸Ｊ１～Ｊ６を特定しない場合は、各軸Ｊ１～Ｊ６を総称して単に軸Ｊと称する。各軸Ｊ１～Ｊ６は、それぞれ個別に例えばサーボモータにより回転駆動することができる。なお、本実施形態において、ロボットアーム１０の姿勢に関する情報とは、各軸Ｊｎの回転角度θｎの集合によって構成されるロボットアーム１０の状態を意味する。この場合の「ｎ」は、各軸Ｊ１～Ｊ６に対応する整数を意味する。例えば角度θ１とした場合、第１軸Ｊ１の角度を意味する。なお、本明細書では、第ｎ軸の回転角度θｎを第ｎ軸角度θｎと称することがある。

【0023】

ここで、第１容器９１内の流体を注ぐ際に、第６軸Ｊ６のみを回転させて第１容器９１を傾けようとすると、第１容器９１の注ぎ口つまり第１容器９１から流体が流出する部分の位置が、上下方向及び水平方向に移動してしまう。このため、通常、人が秤量を行う際は、容器の注ぎ口周辺を支点に容器の底部分を持ち上げるようにして容器を傾ける。このため、本実施形態では、ロボットアーム１０の姿勢に関する情報に用いる軸Ｊｎは、第１容器９１の回転角度に影響する軸この場合第６軸Ｊ６だけでなく、第１容器９１の注ぎ口の位置すなわち流体の流出位置に影響する全ての軸を含んでいる。これにより、秤量システム１は、人の動作をより正確に学習し模倣することができる。

【0024】

第６アーム１２６はロボットアーム１０の手先部分であり、例えばフランジ形状に構成されている。第６アーム１２６の先端部分にはツール部１３が着脱可能に装着される。ツール部１３は、例えばチャックやグリッパと称されるものである。本実施形態の場合、ツール部１３は、第１容器９１を保持することができる。また、ロボットアーム１０は、詳細は図示しないが、各軸Ｊ１～Ｊ６を駆動するためのサーボモータ、各軸Ｊ１～Ｊ６の回転数及び位置を検出するためのエンコーダ、及び各軸Ｊ１～Ｊ６の動作を停止させるためのブレーキ等を有している。

【0025】

制御装置２０は、いわゆるロボットコントローラと称するものであり、ロボットアーム１０の動作を制御する機能を有する。ロボットアーム１０と制御装置２０とは、有線または無線により相互通信可能に構成される。また、制御装置２０は、パソコンや、スマートフォンなどの携帯端末など、その他の外部の装置に有線または無線により相互通信可能に接続されていても良い。制御装置２０は、ロボットアーム１０に内蔵した形態としても良いし、サーバ等によって実現されて遠隔でロボットアーム１０の制御を行う構成であっても良い。また、制御装置２０は、情報処理装置４０と同一又は共通するハードウェアで構成しても良い。

【0026】

制御装置２０は、図１に示すように、例えばＣＰＵ２１、記憶部２２、駆動部２３、及び位置検出部２４を有して構成することができる。記憶部２２は、例えばＲＯＭ、ＲＡＭ、及び書き換え可能なフラッシュメモリなどの記憶領域で構成されており、ロボットアーム１０の動作を制御するコンピュータプログラムを記憶している。駆動部２３は、例えばインバータ回路を含んで構成されており、ロボットアーム１０の各軸Ｊ１～Ｊ６のモータに対する電流を制御することで、各軸Ｊ１～Ｊ６の動作を制御することができる。制御装置２０は、情報処理装置４０から受信するロボットアーム１０の姿勢に関する情報に基づいてロボットアーム１０の動作を制御する。

【0027】

位置検出部２４は、例えば各軸Ｊ１～Ｊ６に対応して設けられたエンコーダ等を含んで構成されており、各軸Ｊ１～Ｊ６の回転角度θｎすなわち各モータの回転角度を検出することができる。制御装置２０は、位置検出部２４で検出した各軸Ｊ１～Ｊ６の位置に基づいて例えばフィードバック制御によりそれぞれのモータを駆動する。制御装置２０は、位置検出部２４で検出した各軸Ｊ１～Ｊ６の位置つまり各モータの回転角度を、取得した時刻と共に情報処理装置４０に送信する。

【0028】

計量器３０は、例えば電子秤等で構成することができる。第２容器９２は、計量器３０に載置されている。計量器３０は、第２容器９２の重量を所定間隔で計測し、その計測結果を、取得時刻と共に情報処理装置４０へ送信する。

【0029】

情報処理装置４０は、図３に示すように、学習用データ生成装置４０１、学習モデル生成装置４０２、及び推論装置４０３を含んで構成されている。学習用データ生成装置４０１、学習モデル生成装置４０２、及び推論装置４０３は、例えばＣＰＵにおいてコンピュータプログラムを実行することにより仮想的に実現される機能部で構成することができる。なお、学習用データ生成装置４０１、学習モデル生成装置４０２、及び推論装置４０３は、同一又は共通するハードウェアで構成することもできるし、異なるハードウェアで構成することもできる。

【0030】

情報処理装置４０のハードウェア構成は、図４に示すように、ＣＰＵ５１、主記憶装置５２、補助記憶装置５３、及びインタフェース５４を含んで構成することができる。補助記憶装置５３は、学習用データ生成装置４０１、学習モデル生成装置４０２、及び推論装置４０３をコンピュータ上で仮想的に実現するための各コンピュータプログラム６１、６２、６３を記憶している。情報処理装置４０は、ＣＰＵ５１が各プログラム６１、６２、６３を補助記憶装置５３から読み出して主記憶装置５２に展開し実行することで、学習用データ生成装置４０１、学習モデル生成装置４０２、及び推論装置４０３をそれぞれコンピュータ上で仮想的に実現することができる。

【0031】

ＣＰＵ５１は、プログラムに従って、学習用データ生成装置４０１で生成された複数の学習用データ６４及び学習モデル生成装置４０２で生成された学習モデル６５を主記憶装置５２又は補助記憶装置５３に記憶させる。本実施形態において、ＣＰＵ５１は、複数の学習用データ６４をコンピュータで利用可能にまとめたもて学習用データ群６４０として主記憶装置５２又は補助記憶装置５３に記憶させることができる。なお、図４に示す学習用データ群６４０に含まれる学習用データ６４は、それぞれ具体的な内容が異なるものであるが、便宜的に同一の符号を付している。

【0032】

補助記憶装置５３は、有形かつ非一時的なコンピュータ可読媒体で構成される。補助記憶装置５３の例としては、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＤＶＤ－ＲＯＭ（Digital Versatile Disc Read Only Memory）、半導体メモリ等が挙げられる。補助記憶装置５３は、情報処理装置４０を構成するコンピュータのバスに直接接続された内部メディアであってもよいし、インタフェース５４または通信回線を介して情報処理装置４０に接続される外部メディアであってもよい。また、各プログラム６１、６２、６３が通信回線によって情報処理装置４０に配信される場合、配信を受けた情報処理装置４０が当該プログラムを主記憶装置５２に展開し実行することで、上記各装置４０１、４０２、４０３が実現される。

【0033】

なお、各装置４０１、４０２、４０３の実現は、上記したハードウェアとプログラムの組み合わせに限らず、装置４０１、４０２、４０３にプログラムをインプリメントした集積回路のようなハードウェア単体で実現するようにしてもよいし、一部の機能を専用のハードウェアで実現し、一部を情報処理装置４０とプログラムの組み合わせで実現するようにしてもよい。

【0034】

学習用データ生成装置４０１は、学習モデル生成装置４０２で用いるための学習用データを生成する機能を有する。学習用データ生成装置４０１は、状態データ取得部４１及び学習用データ生成処理部４２を有している。状態データ取得部４１は、状態データ取得処理を実行可能である。状態データ取得処理は、学習用データすなわち教師データとして、ロボットアーム１０に秤量処理の見本動作を実行させた際のロボットアーム１０及び第２容器９２の状態データを取得する機能を有する処理を含む。

【0035】

状態データ取得部４１は、ロボットアーム１０に見本動作をさせている間に、制御装置２０及び計量器３０から、ロボットアーム１０及び第２容器９２の現時刻における状態データを逐次取得する。見本動作は、ロボットアーム１０が第１容器９１を傾けて所定量の流体を第２容器９２に注いだ後、第１容器９１の傾きを復帰させるまでにおけるロボットアーム１０の一連の動作を含んでいる。また、見本動作は、ロボットアーム１０が第１容器９１の把持を開始した時点からの動作を含むものであっても良い。

【0036】

制御装置２０から取得するロボットアーム１０の状態データには、現時刻（ｔ）におけるロボットアーム１０の各軸Ｊ１～Ｊ６の角度θｎ（ｔ）と、現時刻（ｔ）における各軸Ｊ１～Ｊ６のモータの電流値Ｉｎ（ｔ）と、が含まれる。なお、本実施形態において、電流値Ｉｎにおける「ｎ」は、角度θｎの場合と同様に、各軸Ｊ１～Ｊ６に対応する整数を意味する。例えば電流値Ｉ１とした場合、第１軸Ｊ１に対応したモータの電流値を意味する。

【0037】

また、本明細書では、第ｎ軸のモータの電流値Ｉｎを第ｎ軸電流値Ｉｎと称することがある。各軸Ｊ１～Ｊ６の電流値Ｉｎは、各軸Ｊ１～Ｊ６のモータに作用する負荷によって変化するため、各軸Ｊ１～Ｊ６に作用する負荷に関する情報つまり負荷量として扱うことができる。そして、ロボットアーム１０が第１容器９１を保持している場合、各軸Ｊ１～Ｊ６に作用する負荷は第１容器９１の重量に応じて変化するため、各軸Ｊ１～Ｊ６の電流値Ｉｎは、第１容器９１の重量に関する情報として扱うことができる。

【0038】

学習用データ生成処理部４２は、学習用データ生成処理を実行可能である。学習用データ生成処理は、状態データ取得部４１で取得した状態データから学習用データを生成する処理である。学習用データ生成処理は、ロボットアーム１０の状態データすなわち各時刻における各軸Ｊ１～Ｊ６の角度θｎ（ｔ）及び各時刻における各軸Ｊ１～Ｊ６のモータの電流値Ｉｎ（ｔ）と、各時刻における第２容器９２の重量ｗ（ｔ）とを、取得時刻で対応づけることで学習用データを生成する。

【0039】

すなわち、学習用データは、例えば図５に一例を示すように、各軸Ｊ１～Ｊ６の角度θｎ（ｔ）、各軸Ｊ１～Ｊ６のモータの電流値Ｉｎ（ｔ）、及び第２容器９２の重量ｗ（ｔ）の時系列的なデータである。なお、学習用データには、少なくとも各軸Ｊ１～Ｊ６の角度θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）が含まれている必要があるが、各軸Ｊ１～Ｊ６のモータの電流値Ｉｎ（ｔ）を含めることで、学習モデルの速度及び精度の向上が見込まれる。この場合、学習用データは、ロボットアーム１０の制御装置２０及び計量器３０から直接入手可能な情報のみで構成されており、制御装置２０及び計量器３０以外の装置を用いて入手する情報は含まれていない。学習用データ生成装置４０１は、生成した学習用データを学習モデル生成装置４０２に渡す、又は図４に示す補助記憶装置５３に記憶する。

【0040】

学習用データ生成装置４０１は、例えば図６に示す一連の処理を実行することで、１つの見本動作に基づく学習用データを生成する。そして、学習用データ生成装置４０１は、例えば図６の処理を見本動作の条件を変えて複数回実行することで、条件の異なる複数の見本動作に基づく学習用データを生成する。この場合、変更する見本動作の条件は、第１容器９１及び第２容器９２の形状や重量、第１容器９１及び第２容器９２に予め収容されている初期の流体量、秤量の目標値、流体の種類、及びロボットアーム１０の動作速度、及びロボットアーム１０の動作軌跡等がある。

【0041】

学習用データ生成装置４０１は、まずステップＳ１１において、制御装置２０を介してロボットアーム１０を動作させて秤量の見本動作の実行を開始する。次に、学習用データ生成装置４０１は、ステップＳ１２において状態データ取得部４１の機能によりロボットアーム１０及び計量器３０の現在の状態データを取得する。そして、学習用データ生成装置４０１は、取得した状態データを、ステップＳ１３において主記憶装置５２又は補助記憶装置５３に取得時刻とともに記憶させて時系列的に蓄積する。

【0042】

次に、学習用データ生成装置４０１は、ステップＳ１４において、見本動作が終了したか否かを判断する。見本動作が終了してない場合（ステップＳ１４でＮＯ）、学習用データ生成装置４０１は、見本動作が終了するまでステップＳ１２～Ｓ１４を繰り返す。学習用データ生成装置４０１は、例えばロボットアーム１０が停止してから所定期間経過した場合又は作業者から終了を示す入力操作があった場合等に見本動作が終了したと判断することができる。そして、見本動作が終了すると（ステップＳ１４でＹＥＳ）、学習用データ生成装置４０１は、ステップＳ１５に処理を移行し、学習用データ生成処理部４２の機能により学習用データを生成する。その後、学習用データ生成装置４０１は、一連の処理を終了させる（エンド）。

【0043】

学習モデル生成装置４０２は、複数の学習用データ６４を用いて機械学習することにより、例えば図７に例示する学習モデル６５を生成する機能を有する。学習モデル６５は、第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報すなわち各軸Ｊ１～Ｊ６の回転角度θｎ及び第２容器９２の重量ｗ（ｔ）を入力とし、第２時刻（ｔ＋１）におけるロボットアーム１０の姿勢に関する情報を出力とするニューラルネットワークである。

【0044】

本実施形態の場合、学習モデル６５は、図７に示すように、第１時刻（ｔ）における秤量の目標値Ｄ及び第２容器の重量ｗ（ｔ）、ロボットアーム１０の各軸Ｊ１～Ｊ６の回転角度θｎ（ｔ）に加えて、各軸Ｊ１～Ｊ６のモータの電流値Ｉ（ｔ）も入力としている。また、学習モデル６５は、第２時刻（ｔ＋１）のロボットアーム１０の各軸Ｊ１～Ｊ６の回転角度θｎ（ｔ＋１）を出力としている。なお、第２時刻（ｔ＋１）は、第１時刻（ｔ）よりも後の時刻であり、第１時刻（ｔ）と第２時刻（ｔ＋１）との間隔はデータ量や精度等を考慮して任意に設定することができる。

【0045】

学習モデル６５には、例えばＲＮＮ（Recurrent Neural Network）、ＭＴＲＮＮ（Multi Timescale RNN）、ＬＳＴＭ（Long Short Term Memory）、ＡＲＩＭＡ（Auto Regressive Integrated Moving Average）、又は１次元ＣＮＮ（Convolutional Neural Network）等の時系列データを処理可能なニューラルネットワークを用いることができる。

【0046】

学習モデル生成装置４０２は、図３に示すように、学習用データ取得部４３及び学習処理部４４を有している。学習用データ取得部４３は、学習用データ生成装置４０１又は補助記憶装置５３から複数の学習用データ６４を取得する処理を実行可能である。学習処理部４４は、学習用データ取得部４３が取得した学習用データを用いて機械学習を行い、図７に例示する学習モデル６５を生成する。

【0047】

推論装置４０３は、対象流体を収容した第１容器９１をロボットアーム１０が保持して第１容器９１から第２容器９２に対象流体を注ぐ場合、すなわち秤量処理を実行する際に、学習モデル６５を用いてロボットアーム１０の姿勢に関する情報を出力する機能を有する。推論装置４０３は、状態データ取得部４１及び推論処理部４５を有している。本実施形態の場合、状態データ取得部４１は、学習用データ生成装置４０１と推論装置４０３とで共用しているが、共用しない構成であっても良い。

【0048】

推論処理部４５は、学習モデル６５に第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）を入力して、第２時刻（ｔ＋１）におけるロボットアーム１０の姿勢に関する情報θ（ｔ＋１）を出力する処理を実行可能である。本実施形態の場合、推論処理部４５は、学習モデル６５に第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）に加えて、ロボットアーム１０の力に関する情報つまり各軸Ｊ１～J６のモータの電流値Ｉｎ（ｔ）も入力する。推論処理部４５は、図３に示すように、出力した第２時刻（ｔ＋１）における姿勢に関する情報θｎ（ｔ＋１）を制御装置２０に受け渡す。

【0049】

秤量処理において、計量器３０は、現時刻（ｔ）における第２容器９２の重量ｗ（ｔ）を計測しその計測結果を推論装置４０３に逐次渡すとともに、制御装置２０は、現時刻（ｔ）におけるロボットアーム１０の各軸J１～J６の角度θｎ（ｔ）を取得して推論装置４０３に逐次渡す。すなわち、推論装置４０３は、制御装置２０及び計量器３０から現時刻（ｔ）におけるロボットアーム１０及び第２容器９２の状態データを取得する。そして、制御装置２０は、推論装置４０３から出力された次の時刻（ｔ＋１）におけるロボットアーム１０の各軸J１～J６の角度θｎ（ｔ）となるようにロボットアーム１０の動作を制御する。

【0050】

秤量システム１は、図８に例示するフローに基づいて秤量処理を実行することができる。本実施形態の場合、図１に示すように、第１容器９１及び第２容器９２は、それぞれ容器置き場９３１、９３２に置かれている。ユーザは、秤量処理の実行に先立って目標値Ｄを入力する。秤量システム１は、図８のステップＳ２１において、目標値Ｄを設定する。次に、秤量システム１は、制御装置２０によってロボットアーム１０を動作させて、容器置き場９３１に置かれている第１容器９１を取りに行かせ、第１容器９１を取得した後、第１容器９１を第２容器９２の上方まで移動させる。

【0051】

次に、秤量システム１は、ステップＳ２３～ステップＳ２６を繰り返すことで、第１容器９１を傾けて第２容器９２に流体を目標量注ぎ込む動作すなわち秤量を実行する。秤量システム１は、ステップＳ２３において、推論装置４０３の機能によりロボットアーム１０及び第２容器９２の現時刻（ｔ）における状態データを取得する。次に、秤量システム１は、ステップＳ２４において、推論装置４０３の機能により次の時刻（ｔ＋１）におけるロボットアーム１０の姿勢に関する情報すなわち各軸角度θｎ（ｔ＋１）を算出する。

【0052】

次に、秤量システム１は、ステップＳ２５において、制御装置２０の機能により、ステップＳ２４で算出した各軸角度θｎ（ｔ＋１）となるように、ロボットアーム１０を動作させる。そして、秤量システム１は、ステップＳ２６において、秤量が終了したか否かを判断し、終了していない場合（ステップＳ２６でＮＯ）はステップＳ２３に処理を戻し、終了した場合（ステップＳ２６でＹＥＳ）はステップＳ２７に処理を移行する。なお、秤量が終了したか否は、例えば第１容器９１の傾きが初期状態すなわちステップＳ２２の状態に戻ったことや、第２容器９２の重量変化が所定期間生じていなことなどを基準として判断することができる。その後、秤量システム１は、第１容器９１を元の容器置き場９３１に戻す等して、一連の秤量処理を終了する。

【0053】

以上説明した一実施形態によれば、学習モデル６５の生成方法は、まず、学習用データ６４を取得する。学習用データ６４は、対象流体を収容した第１容器９１を保持して第１容器９１から第２容器９２に対象流体を注ぐ際のロボットアーム１０の姿勢に関する時系列の情報θｎと、第２容器９２の時系列の重量ｗと、を含む学習用データを複数有している。次に、学習用データ６４に含まれる学習用データを用いて、第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）を入力とし、第２時刻（ｔ＋１）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ＋１）を出力とする学習モデル６５を生成する。

【0054】

また、本実施形態の学習用データ生成方法は、対象流体を収容した第１容器９１を保持して第１容器９１から第２容器９２に対象流体を注ぐ際のロボットアーム１０の姿勢に関する時系列の情報θｎを取得する処理と、第２容器９２の時系列の重量ｗを取得する処理と、ロボットアーム１０の姿勢に関する時系列の情報θｎと第２容器９２の時系列の重量ｗとを対応付ける処理と、を含む。

【0055】

また、本実施形態の推論方法は、対象流体を収容した第１容器９１をロボットアーム１０が保持して第１容器９１から第２容器９２に対象流体を注ぐ場合に、第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）を取得し、第１時刻ｔにおける第２容器９２の重量ｗ（ｔ）を取得し、第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）を入力とし、第２時刻（ｔ＋１）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ＋１）を出力とする学習用データ６４を用いて学習させた学習モデル６５に、取得した第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）を入力して、第２時刻（ｔ＋２）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ＋１）を出力する。

【0056】

そして、本実施形態の秤量方法は、対象流体を収容した第１容器９１をロボットアーム１０が保持して第１容器９１から第２容器９２に対象流体を注ぐ方法である。秤量方法は、第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）を取得するステップと、第１時刻（ｔ）における第２容器の重量を取得するステップと、取得した第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）を入力して、第２時刻（ｔ＋１）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ＋１）を出力するステップと、第２時刻（ｔ＋１）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ＋１）に基づいてロボットアーム１０の動作を制御するステップと、を含む。学習モデル６５は、第１時刻（ｔ）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ）及び第２容器９２の重量ｗ（ｔ）を入力とし、第２時刻（ｔ＋２）におけるロボットアーム１０の姿勢に関する情報θｎ（ｔ＋１）を出力とする学習用データ６４を用いて学習させたものである。

【0057】

ここで、機械学習を用いずに秤量処理を行うとすると、第１容器９１に収容されている流体の粘性や、第１容器９１及び第２容器９２に予め収容されている流体の量、及び目標とする秤量値のパラメータによって、ロボットアーム１０の動作を変更する必要があるため、ロボットアーム１０の制御プログラムも変更する必要がある。この場合、目標とする秤量値と計量器３０の値との差を基にロボットアーム１０の動作を変化させることが必要となるが、入力データの量や判断項目が多すぎるため、全てのパターンに対応した制御プログラムを準備することは極めて難しい。

【0058】

これに対し、本実施形態によれば、機械学習によって得られた学習モデル６５に基づいてロボットアーム１０を動作させるため、第１容器９１に収容されている流体の粘性や、第１容器９１及び第２容器９２に予め収容されている流体の量、及び目標とする秤量値のパラメータに応じるために多数の制御プログラムを準備する必要がない。その結果、ロボットアーム１０を用いて流体を秤量する構成において、第１容器９１の形状や流体の種類等の変化に柔軟に対応することができる。

【0059】

また、本実施形態によれば、従来の機械学習を用いて行う秤量に対して以下のような改善を図ることができる。まず、本願発明者は、秤量のための機会学習の入力データとして、第１容器９１の角度と第１容器９１の画像又は映像と第２容器９２の重量との３つの情報を利用しなくても、第１容器９１を保持するロボットアーム１０の姿勢に関する情報と第２容器９２の重量との２つの情報を用いることで、上記した３つの情報を用いた場合と同等かそれ以上の精度及び期間で秤量を行えることを見出した。

【0060】

そして、本実施形態の秤量システム１は、ロボットアーム１０の動作の機械学習及び動作の制御に第１容器９１の画像又は映像等を利用しないため、カメラ等の光学機器を含まない簡単な構成とすることができる。また、画像や映像は、ロボットアーム１０の姿勢に関する情報θｎや第２容器９２の重量に比べてデータ容量が極めて大きい。そのため、秤量システム１は、ロボットアーム１０の制御及び機械学習に第１容器９１の画像又は映像等を利用しないことにより、情報処理装置４０で処理すべきデータ容量を低減し、これにより、秤量処理の速度を向上させることができる。

【0061】

更に、本実施形態の秤量システム１は、ロボットアーム１０の動作の機械学習及び動作の制御にロボットアーム１０の姿勢に関する情報θｎを用いる。これによれば、秤量処理時において第１容器９１の画像又は映像を用いなくても、高精度でかつ高速に秤量処理を行うことができる。

【0062】

また、学習用データ６４は、ロボットアーム１０に作用する負荷に関する情報、この場合、各軸Ｊ１～Ｊ６のモータの電流値Ｉｎを含んでいる。これによれば、学習モデル６５を、ロボットアーム１０の各軸Ｊ１～Ｊ６に作用する負荷すなわち第１容器９１の重量の要素を含めたものとすることができる。これにより、学習モデル６５の精度を更に向上させることができ、その結果、更に高精度でかつ高速に秤量処理を実行することができる。

【0063】

なお、上記説明した各実施形態は、上記し且つ図面に記載した各実施形態に限定されるものではなく、発明の要旨を逸脱しない範囲において適宜変更することができる。

【符号の説明】

【0064】

１…秤量システム、１０…ロボットアーム、２０…制御装置、４１…状態データ取得部、４２…学習用データ生成処理部、４３…学習用データ取得部、４４…学習処理部、４５…推論処理部、６４…学習用データ、６５…学習モデル、９１…第１容器、９２…第２容器、４０１…学習用データ生成装置、４０２…学習モデル生成装置、４０３…推論装置

【図1】